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本 书 主要 内 容 包括 三 部 分 : SEAR EAC SUME. SD RA PAL ALIE 
微 控 制 器 。 第 一 部 分 介绍 了 基础 的 HDL 结构 和 对 应 硬件 ， 并 示范 如 
何 用 这 些 结构 来 搭建 基本 的 数字 电路 。 第 二 部 分 是 应 用 第 一 部 分 的 技 
术 为 原型 板 设计 外 围 模块 ， 介 绍 了 一 个 单独 外 设 的 开发 、 实 现 和 验 
证 。 可 以 将 这 些 模 块 组 成 一 个 复杂 的 系统 。 第 三 部 分 介绍 了 基于 FP- 
GA 的 软 核 微 控制 器 ， 即 PieoBlaze， 展 示 了 如 何 将 通用 处 理 器 和 定制 
电路 进行 集成 。 本 书 通 过 实例 深入 浅 出 地 介绍 了 使 用 Verilog 对 可 编 
程 逻辑 器 件 进行 设计 的 方法 ， 不 仅 介 绍 了 HDL 的 语法 ， 还 重点 介绍 
了 对 可 编程 逻辑 器 件 的 设计 方法 ， 提 供 了 一 系列 使 用 Verilog 对 可 编 
程 逻 辑 器 件 进行 设计 的 实例 ， 书 中 的 实例 均 可 运行 于 Xilinx 公司 的 
Spartan-3 原型 开发 板 中 ， 使 读者 能 够 边 动手 边 学 习 ， 达 到 快速 人 门 并 
掌握 其 要 领 的 目的 。 

本 书 可 作为 可 编程 逻辑 器 件 的 学 习 指 导 书 ， 通 过 书 中 的 案例 ， 初 
学 者 最 终 可 以 完全 掌握 可 编程 逮 辑 器 件 的 设计 。 同 时 ， 也 可 作为 工程 
实践 的 指导 用 书 ， 对 提高 可 编程 逻辑 器 件 开 发 人 员 的 设计 水 平 有 借鉴 


° 
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由 于 可 编程 逻辑 器 件 具 有 集成 度 高 、 体 积 小 、 功 耗 低 、 吉 度 快 等 诸多 优点 ， 
在 航空 、 航 天 等 军用 产品 领域 中 获得 了 广泛 的 应 用 。 然 而 ， 可 编程 逻辑 器 件 的 开 
发 与 以 往 软 件 或 硬件 的 开发 有 着 很 大 的 不 同 ， 随 着 大 量 可 编程 远 辑 器 件 设 计 的 增 
加 ， 如 何 提高 开发 人 员 的 设计 水 平成 为 保障 可 编程 逻辑 器 件 安全 性 的 关键 因素 。 

本 书 是 介绍 使 用 Verilog 对 可 编程 远 辑 器 件 进行 设计 的 技术 著作 ， 主 要 聚焦 
在 对 可 编程 远 辑 器 件 的 设计 ， 而 不 仅仅 是 介绍 HDL 的 语法 。 本 书 提 供 了 一 系列 
使 用 Verilog 对 可 编程 远 辑 器 件 进 行 设计 的 实例 ， 这 些 例 子 可 作为 通用 的 基本 模 
块 组 合成 结构 复杂 的 大 系统 。 本 书 主要 内 容 包 括 三 部 分 : 基本 的 数字 电路 、 外 转 
模块 和 内 谈 的 微 控制 器 。 作 者 Pong P. Chu 在 使 用 Verilog 对 可 编程 逻辑 器 件 进行 
设计 方面 有 多 年 的 工程 实践 经 验 。 本 书 以 实例 为 依托 深入 浅 出 地 介绍 了 使 用 Ver- 
ilog 对 可 编程 逻辑 器 件 进行 设计 的 方法 ， 并 给 出 很 多 Verilog 语言 的 使 用 方法 ， 对 
工程 实践 有 一 定 的 借鉴 价值 ， 对 提高 可 编程 逻辑 器 件 开 发 人 员 的 设计 水 平 有 一 定 
帮助 。 

当 夏 字 闻 教授 将 本 书 的 英文 版 《FPGA PROTOTYPING BY VERILOG EXAM- 
PLEES》 推 荐 给 我 们 时 ， 我 们 欣喜 地 发 现 本 书 对 提高 可 编程 逻辑 器 件 开 发 人 员 的 
设计 水 平 有 很 大 的 帮助 。 当 夏 宇 闻 教授 建议 我 们 结合 工程 应 用 中 的 实践 经 验 ， 将 
本 书 翻译 成 中 文 时 ， 我 们 立即 欣然 答应 。 我 们 所 在 的 单位 一 一 航天 科 工 集团 三 院 
三 D 四 所 ， 主 要 负责 软件 和 可 编程 远 辑 器 件 软件 的 测试 及 工程 化 工作 ， 自 成 立 以 
来 承担 了 院内 、 空 间 领 域 、 军 用 领域 上 百 个 型 号 的 测试 工作 ， 其 中 可 编程 逻辑 器 
件 软 件 的 测试 工作 占 30% 以 上 ， 积累 了 丰富 的 可 编程 逻辑 设计 与 验证 方面 的 经 
验 。 我 们 相信 中 文 版 的 出 版 将 给 使 用 Verilog 对 可 编程 逻辑 器 件 进行 设计 的 开发 
人 员 提 供 更 多 的 帮助 。 

参与 本 书 翻译 工作 的 人 员 有 和 孟 伟 、 李 艳 志 、 王 俊 、 于 林 字 、 张 津 荣 、 刘 军 、 
ШФ. Иж. ЕЖ. Жа. Ж. ЖЮ. ФА. Э. "5. ЖЕТ. а 
Ж. ЖЕ. MS. RH. CERA. RR, R X>. KRSM, AM, КЕШ, TH 
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开发 和 测试 工作 的 技术 人 员 ， 具 有 多 年 可 编程 远 辑 器 件 软件 的 开发 和 测试 工作 经 
验 ， 为 探 月 工程 、 载 人 航天 工程 、 空 间 科学 先导 专项 等 国家 重大 项 目 中 多 个 型 号 
的 顺利 完成 保驾 护航 。 全 书 由 夏 宇 闻 教 授 负责 审 校 。 

在 《FPGA PROTOTYPING BY VERILOG EXAMPLES》 中 文 版 即将 出 版 之 时 ， 
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HDL (硬件 描述 语言 ) 和 FPGA (现场 可 编程 门 阵列 ) 器 件 可 以 使 设计 者 很 
快 地 完成 复杂 数字 电路 的 开发 和 仿真 ， 并 在 样机 器 件 上 实现 ， 随 后 对 器 件 电 路 的 
实际 运行 情况 进行 检查 。 随 着 工艺 的 成 熟 ，HDL 和 FPGA 已 经 成 为 设计 实践 的 
主流 。 利 用 PC 和 普通 的 FPGA 开发 板 就 能 构造 出 十 分 复杂 的 数字 系统 。 本 书 采 
用 实际 操作 的 学 习 方法 ， 利 用 丰富 的 示例 来 阐述 FPGA 和 HDL 的 开发 和 设计 过 
程 。 书 中 包含 了 大 量 实例 ， 从 简单 的 门 级 电路 ， 到 带 有 8 位 软 核 处 理 器 和 定制 U 
0 外 设 的 复杂 嵌入 式 系 统 。 所 有 这 些 例子 都 可 以 被 综合 成 具体 电路 ， 并 在 开发 板 
上 进行 实际 测试 。 
本 书 关注 重点 

本 书 关注 的 重点 是 综合 后 生成 硬件 的 优 劣 ， 而 不 是 HDL 语法 。 本 书 只 关注 
一 小 部 分 可 综合 子 集 ， 并 使 用 少量 的 代码 模板 为 不 同类 型 的 电路 提供 框架 ， 而 不 
是 解释 每 一 个 语句 的 结构 。 这 些 模板 都 是 通用 的 ， 很 容易 综合 到 复杂 的 系统 中 。 
虽然 这 种 方法 限制 了 语法 表达 的 “自由 ”,， 但 并 不 妨碍 我 们 开发 创新 性 的 硬件 结 
构 。 由 于 HDL 语言 的 通用 性 和 适应 性 ， 同 一 个 电路 通常 可 以 用 多 种 语言 结构 和 
代码 风格 表达 。 其 中 许多 代码 是 用 于 建 模 的 。 这 些 代码 综合 后 可 能 导致 不 必要 的 
复杂 硬件 实现 ， 有 时 还 根本 不 可 能 综合 成 任何 具体 电路 。 这 种 模板 方式 实际 上 能 
够 促使 我 们 更 多 地 去 思考 硬件 电路 本 身 ， 养 成 良好 的 编码 习惯 。 由 于 我 们 的 主要 
兴趣 是 在 硬件 上 ， 所 以 花 一 些 时 间 研 究 如 何 使 用 同一 个 代码 模板 来 开发 多 种 不 同 
的 硬件 结构 ， 而 不 是 用 多 种 不 同 版 本 的 代码 来 描述 同一 个 电路 是 十 分 有 价值 的 。 

目前 有 两 种 流行 的 HDL 语言 ， 它 们 分 别 是 VHDL 和 Verilog。 这 两 种 语言 都 
得 到 广泛 的 应 用 ， 并 且 都 是 IEEE 标准 。 本 书 使 用 Verilog， 而 另 一 本 标题 类 似 的 
书 使 用 VHDL。 尽 管 两 者 的 语法 差异 较 大 ， 但 它们 的 功能 却 非常 相似 ， 都 能 很 好 
地 达到 设计 目标 。 当 我 们 掌握 了 一 种 语言 的 设计 实践 和 编码 方法 后 ， 再 学 习 另 一 
种 语言 就 会 变 得 非常 简单 。 

虽然 本 书 是 为 初学 者 编写 的 ， 但 书 中 的 示例 都 严格 遵循 设计 准则 ， 可 为 读者 
今后 的 工作 打下 良好 的 基础 。 编 码 和 设计 方法 是 “向 上 兼容 的 ”， 意 思 是 : 

e 同样 的 方法 可 应 用 于 未 来 的 大 型 设计 之 中 。 

e 同样 的 方法 能 够 有 助 于 其 他 的 系统 开发 任务 ， 包 括 仿真 、 时 序 分 析 、 验 
证 和 测试 。 

e 同样 的 方法 能 够 被 应 用 到 ASIC 技术 和 不 同类 型 的 FPGA SHH, 
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e 代码 能 够 被 不 同 厂家 的 综合 软件 综合 。 

总 之 ， 本 书 是 一 本 实用 的 、 以 硬件 为 核心 的 教材 ， 其 内 容 涉 及 用 最 简洁 的 
HDL、 遵 循 规 范 的 设计 和 编码 原则 ， 最 大 限度 地 实现 向 上 兼容 。 
购买 本 书 的 益处 

本 书包 含 三 大 部 分 : 

基本 数字 电路 、 外 设 模 块 和 嵌入 式微 控制 器 。 针 对 的 读者 群 除 了 正在 学 习 入 
门 级 或 者 高 级 数字 系统 设计 课程 的 学 生 外 ， 还 包括 想 要 学 习 FPGA 和 基于 HDL 
开发 的 在 职工 程 师 。 对 于 书 中 前 两 部 分 内 容 ， 需 要 读者 具有 数字 系统 的 基本 知 
识 ， 而 数字 系统 通常 是 电子 工程 和 计算 机 工程 专业 课程 中 的 必修 课 。 对 于 第 三 部 
分 的 内 容 而 言 ， 如 果 读者 之 前 学 习 过 汇编 语言 编程 将 会 很 有 帮助 。 
本 书 所 采用 的 工具 

虽然 本 书 的 主要 目标 是 教会 读者 如 何 编 写 与 开发 工具 和 FPGA 器 件 无 关 的 
HDL 代码 ， 但 我 们 必须 得 选择 一 种 开发 工具 ( 即 软 件 包 ) 和 一 套 FPGA 开发 板 
来 进行 综合 和 实现 这 些 示例 。 本 书 使 用 了 Xilinx 公司 的 综合 工具 和 FPGA BH; 
Xilinx 公司 是 一 家 在 该 领域 处 于 领导 地 位 的 公司 。 
软件 

使 用 的 综合 软件 是 Xilinx ISE 开发 套件 的 网 络 版 。 与 完全 版 的 套件 相 比 ， 网 
络 版 除了 支持 的 器 件数 量 受 限 外 ， 功 能 与 完全 版 是 类 似 的 。 大 多 数 入 门 级 开发 板 
都 使 用 便宜 的 Spartan-3 系列 FPGA 器 件 。 由 于 网 络 版 支持 Spartan-3 器 件 ， 因 此 
它 符 合 我 们 的 需求 。 本 书 使 用 的 仿真 软件 是 Mentor Graphics 公司 的 ModelSim XE 
亚 入 门 版 。 它 是 ModelSim 的 定制 版 。 这 两 个 软件 包 都 是 免费 的 ， 并 且 能 够 从 
Xilinx 网 站 上 下 载 。 
FPGA 开发 板 

使 用 由 Digilent Ine 公司 生产 的 几 款 入 门 级 FPGA 开发 板 ， 其 中 包括 Spartan-3 
Starter, Nexys-2 和 Basys 等 开发 板 ， 它 们 都 包含 一 个 Spartan-3/3E FPGA 芯片 和 
相似 的 外 围 电路 。 书 中 的 设计 示例 是 基于 Spartan-3 Starter FAR (或 简称 为 S3 
ж) 的 ,但 大 多 数 示例 也 能 在 其 他 开发 板 上 直接 使 用 。HDL 代码 的 适用 性 总 结 
如 下 : 

€ Spartan 3 Starter (53) FRH., 53 开发 板 包 含 所 有 的 外 围 器 件 ， 不 需要 
其 他 的 附属 模块 。 所 有 的 HDL 代码 和 相关 讨论 能 够 直接 应 用 在 这 块 开发 板 上 。 

e Nexys-2 开发 板 。Nexys-2 开发 板 是 一 块 比 较 新 的 开发 板 ， 包 含 了 一 片 较 
大 型 的 FPGA 芯片 和 存储 芯片 。 外 围 器 件 与 53 开发 板 相 似 。 与 S3 开发 板 有 两 处 
ЖЕ: 第 一 ， 其 VGA 接口 的 “颜色 深度 ”由 3 位 扩展 到 8 位。 因此 ， 第 13 章 和 
第 14 章 讨 论 的 VGA 接口 电路 的 输出 需要 根据 情况 进行 相应 的 修改 。 第 二 ，Nex- 
ys-2 板 包 含 更 复杂 的 外 部 存储 器 。 尽 管 能 够 配置 为 异步 SRAM， 但 其 时 序 特 性 与 
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53 开发 板 上 的 存储 芯片 是 不 同 的 ， 因 此 第 11 章 描 述 的 存储 控制 器 HDL 代码 便 
不 能 直接 使 用 。 但 同样 的 设计 准则 依然 可 以 应 用 于 新 的 控制 器 的 构造 。 

e Basys 开发 板 。Basys 开发 板 是 一 个 简易 的 开发 板 。 缺 少 RS-232 连接 器 。 
为 了 实现 第 8 章 描述 的 UART 模块 和 串 行 接口 ， 我 们 需要 Digilent 的 RS-232 转换 
器 外 设 模块 。Basys 开发 板 没有 外 部 存储 器 件 ， 因 此 第 11 章 描 述 的 存储 控制 器 无 

e 其 他 FPGA 开发 板 。 本 书 描述 的 大 部 分 外 设 器 件 其 实 都 是 工业 级 标准 的 
器 件 ， 并 且 相 应 的 HDL 代码 能 够 被 用 于 开发 板 上 ， 只 要 开发 板 提供 类 似 的 接口 
和 连接 器 。 除 了 Xilinx 特定 的 部 分 外 ， 这 些 代码 也 能 够 应 用 于 其 他 厂商 设计 的 基 
于 FPCA 器 件 的 开发 板 上 。 

PC 的 附件 

设计 示例 包含 了 用 于 连接 PC 外 围 设 备 的 接口 。 键 盘 、 和 鼠标 和 УСА 显示 器 
是 必需 的 ， 还 需要 一 条 用 于 连接 UART 模块 的 普通 串 行 数 据 线 。 这 些 外 设 使 用 广 
泛 ， 通 常 可 以 在 一 台 旧 的 PC 上 找到 。 

本 书 的 结构 

本 书 分 为 3 个 主要 部 分 。 第 一 部 分 介绍 了 基础 的 HDL 结构 和 对 应 硬件 ， 并 
示范 如 何 用 这 些 结构 来 搭建 基本 的 数字 电路 。 本 部 分 由 7 个 章节 组 成 : 

e 第 1 章 介 绍 了 HDL 程序 的 结构 、 基 础 语法 和 逻辑 操作 符 。 根 据 这 些 语言 
结构 ， 可 以 推导 出 相应 的 门 级 组 合 电 路 。 

e 第 2 章 介 绍 了 FPGA 器 件 、 原 型 板 和 开发 流程 。 借 助 于 Xilinx ISE 综合 软 
件 教 程 和 Mentor Graphics ModelSim 仿真 软件 教程 进行 开发 过 程 的 示范 。 

e 第 3 章 介绍 了 与 HDL 语言 相关 的 操作 符 和 算法 操作 符 及 其 电路 的 结构 。 
它们 与 中 规模 元 件 ( 如 比较 器 、 加 法 器 和 多 路 复 用 开关 等 元 件 ) 对 应 。 模 块 级 
组 合 电路 就 是 由 这 些 语言 结构 得 到 的 。 

e 第 4 章 介绍 了 存储 元 件 和 构造 简单 时 序 电路 的 代码 ， 例 如 计数 器 和 移 位 
寄存 器 ， 这 些 电路 的 状态 转移 表现 为 简单 的 有 序 模式 。 

e 第 5 章 讨论 了 有 限 状态 机 (FSM) 的 构建 ， 有 限 状 态 机 也 是 一 种 时 序 电 
路 ,但 它 的 状态 转移 表现 为 复杂 的 非 有 序 模式 。 

e 第 6 章 介 绍 了 带 有 数据 路 径 的 有 限 状 态 机 (FSMD) 的 构建 。FSMD 用 于 
实现 寄存 器 传输 (RT) 方法 学 ， 通 过 数据 在 寄存 期 间 的 传输 和 操作 ， 描 述 系统 
的 运行 。 

e 第 7 章 介 绍 了 关于 语言 构造 和 编码 技术 方面 的 若干 高 级 话题 ， 并 介绍 了 
更 加 复杂 测试 平台 的 开发 技术 。 读 者 可 以 跳 过 该 章 ， 不 会 影响 对 其 他 章节 的 理 
解 。 

第 二 部 分 是 应 用 第 一 部 分 的 技术 为 原型 板 设 计 一 系列 外 围 模 块 。 每 章 介 绍 一 
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个 单独 外 设 的 开发 、 实 现 和 验证 。 可 以 将 这 些 模块 组 成 一 个 更 大 的 工程 。 该 部 分 
包括 7 个 章节 : 

e 第 8 章 介 绍 了 普通 的 异步 收发 送 器 (UART) 的 设计 ， 用 于 提供 原型 板 上 
的 RS-232 接口 接收 和 发 送 数据 的 串 行 链 路 。 

e 第 9 章 介 绍 了 键盘 接口 的 设计 ， 可 以 从 键盘 上 读 取 扫描 码 。 键 盘 通过 开 
发 板 上 的 PS2 接口 与 其 连接 。 

e 第 10 章 介绍 了 鼠标 接口 的 设计 ， 可 以 从 和 鼠标 上 获得 点 击 和 移动 信息 。 鼠 
标 也 是 通过 开发 板 上 的 PS2 接口 与 其 连接 。 

e 第 11 章 讨论 了 存储 控制 器 的 实现 和 时 序 。 该 控制 器 用 于 对 53 板 上 的 两 
个 静态 随机 存储 器 (SRAM) 读 取 和 写 入 数据 。 

e 第 12 章 讨论 了 Spartan-3 器 件 中 特定 元 件 的 推断 和 使 用 。 重 点 是 FPGA 的 
内 部 存储 块 。 

@ 第 13 章 介绍 了 一 个 视频 控制 器 的 设计 和 实现 。 讨 论 的 内 容 包 括 视 频 同 步 
信号 的 产生 并 展示 了 比特 映射 和 对 象 映 射 图 像 界面 的 构造 。 显 示 器 通过 开发 板 上 
的 VGA 接口 进行 连接 。 

e 第 14 章 继续 介绍 视频 控制 器 的 开发 。 讨 论 展示 了 文字 界面 和 常规 分 片 映 
射 机 制 的 构建 。 

第 三 部 分 介绍 了 基于 FPGA 的 软 核 微 控制 器 ， 即 PicoBlaze， 展 示 了 如 何 将 通 
用 处 理 器 和 定制 电路 进行 集成 。 该 部 分 包括 4 个 章节 : 

e 第 15 章 对 PicoBlaze 的 结构 和 指令 集 进行 了 简介 。 

e 第 16 章 对 基本 的 汇编 语言 编程 进行 了 介绍 ， 并 提供 了 一 个 总 的 开发 流 
程 。 

e #17 章 讨论 了 PicoBlaze 65 VO 特性 ， 并 展示 了 如 何 将 其 与 其 他 外 设 通 过 
定制 电路 连接 起 来 。 

e 第 18 章 讨论 了 PicoBlaze 的 中 断 性 能 ， 并 展示 了 一 个 定制 的 中 断 处 理 电路 
的 构建 。 

除了 常规 的 章节 ， 附 录 部 分 总 结 和 列 出 了 所 有 的 代码 模版 。 
特殊 标识 本 书 中 我 们 使 用 了 两 种 特殊 的 段落 标记 : 一 个 是 为 了 描述 
Xilinx-specific (Xilinx 公司 特有 的 ) 特性 ， 另 一 个 是 为 了 描述 Verilog-1995 的 结 
构 。 虽 然 在 本 书 中 描述 的 例子 是 基于 Xilinx 开发 板 来 实现 的 ， 并 且 代 码 也 是 采用 
Xilinx ISE 软件 进行 综合 ， 我 们 仍 设法 使 HDL 代码 不 依赖 于 器 件 和 软件 。 本 书 提 
到 的 大 多 数 内容 和 代码 能 够 应 用 到 不 同 的 目标 器 件 ， 也 可 以 被 不 同 的 综合 软件 综 
合 。 然 而 ， 一 些 代码 或 器 件 特性 是 Xilinx ISE 或 者 Spartan-3FPGA 2% А ЕЖ tho 
我 们 用 Xilinx specific 上 标 ， 表 示 相 应 的 部 分 或 者 章节 的 内 容 仅 是 针对 Xilinx 公司 
的 器 件 。 
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同样 ， 像 在 这 一 页 的 边缘 ， 我 们 用 边缘 标记 来 表明 这 段 的 内 容 仅 针对 Xil- 
inx。 这 些 标 记 表 明代 码 或 设计 不 可 直接 移植 ， 需 要 针对 不 同 的 软件 包 或 目标 板 
对 代码 和 设计 进行 修改 。1995 年 Verilog 语言 第 一 次 得 到 批准 (被 引用 作 Verilog- 
1995), ， 并 在 2001 年 修订 (被 引用 作 Verilog-2001) 。 修 订 版 有 很 多 改进 。 本 书 中 
使 用 的 是 Verilog-2001。 如 果 一 种 语言 使 用 了 两 种 不 同 版 本 进行 构建 ， 我 们 会 将 
其 分 开 ， 单 独 对 旧版 本 进行 描述 ， 并 在 页 边缘 做 上 标记 ， 用 于 这 种 类 型 的 讨论 。 
AAS “HAH”, ， 目 的 是 帮助 读者 理解 旧版 本 的 Verilog 代码 。 
指导 价值 i 

本 书 可 作为 数字 系统 概论 或 者 高 级 工程 指导 的 参考 书 。 在 数字 系统 概论 中 ， 
本 书 提供 了 课程 的 试验 部 分 。 第 一 部 分 的 章节 基本 上 都 遵循 了 典型 的 课程 顺序 ， 
可 作为 常规 课程 的 参考 。 可 以 选择 一 两 个 外 设 模块 作为 案例 进行 学 习 ， 相 应 的 实 
验 可 作为 学 期 实验 。 

在 高 级 工程 指导 课程 中 ， 本 书 提供 了 独立 开展 工程 的 基础 。 在 第 一 部 分 的 章 
节 可 以 看 作 是 复习 资料 ， 里 面 提供 了 HDL、 综 合 和 FPGA 开发 板 的 基本 背景 。 第 
二 部 分 的 一 些 模 块 示例 可 用 于 示范 更 复杂 的 电路 设计 。 这 些 模块 也 可 以 看 作 是 基 
本 模块 (PP IPs) 或 集成 到 最 终 工程 的 子 系统 。 如 果 需 要 设计 一 个 嵌入 式 系统 ， 
那么 第 三 部 分 讨论 的 PicoBlaze 微 控 制 器 可 用 作 一 个 通用 处 理 器 。 
相关 网 站 

本 书 的 配套 网 站 (http://acadernic. csuohio. edu/chu_p/rtpl) 提供 了 其 他 信 
息 ， 包 括 以 下 内 容 : 

e 勘误 表 ; 

e 编码 模型 ; 

e HDL 代码 示例 和 相关 文档 ; 

e 仿真 和 综合 软件 的 下 载 链接 ; 

e 参考 资料 的 下 载 链接 ; 

e 其 他 工程 概念 。 
勘误 表 本 书 为 自 编 书籍 ， 即 作者 完成 了 本 书 的 所 有 部 分 ， 包 括 示 例 、 图 表 、 代 
码 示 例 、 索 引 和 格式 。 错 误 的 出 现 不 可 避免 ， 因 此 本 书 的 配套 网 站 提供 了 最 新 的 
勘误 表 ， 并 提供 了 错误 报告 。 
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Ят 门 级 组 合 电路 


1.1 简介 


Verilog 语言 是 一 种 硬件 描述 语言 ， 产 生 于 20 世纪 80 年 代 中 期 ， 后 成 为 了 
IEEE (美国 电气 电子 工程 师 学 会 ) 标准 ， 即 IEEE-1364 标准 。 该 标准 于 1995 年 
得 到 批准 ( 即 Verilog-1995) ， 并 于 2001 年 进行 了 修订 〈 即 Verilog-2001) 。 修 订 
版 有 很 多 改进 。 本 书 中 使 用 的 是 Verilog-2001。 

Verilog 用 于 在 不 同 级 别 上 对 数字 系统 描述 和 建 模 ， 是 一 种 极其 复杂 的 语言 。 
本 书 重点 在 于 硬件 设计 而 并 非 语言 本 身 。 我 们 将 通过 分 析 和 研究 一 系列 实例 来 介 
绍 关键 的 Verilog 综合 结构 ， 而 不 是 覆盖 Verilog 语言 的 每 一 方面 。 一 些 高 级 主题 
将 在 第 7 章 加 以 分 析 ， 详 细 的 Verilog 全 方位 使 用 可 通过 本 章 最 后 列 出 的 参考 文 
献 部 分 加 以 探究 。 

尽管 Verilog 的 语法 在 某 种 程度 上 与 C 语言 类 似 ， 它 的 语义 ( 即 “ 意 义 ”) 
却 是 以 并 发 的 硬件 操作 为 基础 ， 这 与 C 语言 的 顺序 执行 完全 不 同 。 一 些 语言 构 
造 上 的 细微 的 差别 和 一 些 Verilog 语言 所 固有 的 非 确定 性 行为 能 够 导致 难以 检测 
的 错误 并 引入 仿真 和 综合 之 间 的 差异 。 本 书 的 代码 遵循 “安全 比 有 问题 更 重要 ” 
原则 ， 不 使 用 速写 和 短 代码 ， 而 重点 考虑 代码 风格 及 构造 结构 是 否 清晰 可 综合 并 
能 精确 描述 想 要 的 硬件 。 

在 本 章 ， 我 们 用 一 个 简单 的 比较 天 来 说 明 一 段 Verilog 程序 的 框架 。 该 描述 
只 使 用 逮 辑 运算 符 描述 了 一 个 由 简单 的 逻辑 门 构成 的 门 级 比较 电路 。 在 第 3 章 ， 
我 们 再 介绍 余下 的 Verilog 运算 符 及 结构 ， 并 分 析 由 加 法 器 、 比 较 器 、 乘 法 器 等 
中 等 规模 单元 组 成 的 КТІ, 〈 寄 存 器 传输 级 ) 组 合 电路 。 


1.2 一 般 描述 


考虑 有 两 个 输入 10 和 il 和 一 个 输出 eq 的 1 位 #171 一 位 比较 器 真 值 表 
比较 器 。 当 i0 和 il 相等 时 信号 eq 置 位 。 该 电路 的 输入 
真 值 表 如 表 1-1 所 示 。 — 

假设 我 们 想 要 使 用 非 (not), 5j (and), zX | : 
(or) 及 异 或 (xor) 运算 的 基本 逻辑 门 来 实现 该 电 1 1 
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路 ， 一 种 描述 电路 的 方法 就 是 使 用 乘积 项 的 形式 。 逻 辑 表达 式 为 
eq =i0 » il +i0’ + il’ 
一 种 可 行 的 Verilog 代码 如 示例 1. 1 所 示 。 我 们 在 下 面 的 小 节 中 分 析 语 言 结 
构 和 代码 。 
示例 1.1 一 位 比较 器 的 门 级 实现 


module eql 
//VO % Ll 
( 
input wire 10,11, 
output wire eq 
^s 
// fg tz PB 
wire pO, pl ; 
// 程序 体 
// BAT FCA 
assign eq = pOlpl ; 
// RE 
assign pO = ~i0 & ~il; 
assign pl =i0 & il; 
endmodule 


理解 一 段 HDL( 硬 件 描述 语言 ) 程序 最 好 的 办 法 是 将 其 想象 成 一 个 硬件 电路 。 
上 述 程序 包含 3 个 部 分 。LO 端口 部 分 用 于 描述 该 电路 的 输入 /输出 端口 ,分 别 为 
i0, il Req. 信号 声明 部 分 指定 了 内 部 连接 信号 ,分 别 为 pO 和 pl。 程 序 体 部 分 描述 
了 电路 的 内 部 组 织 结构 。 此 段 代 码 中 有 3 个 连续 赋值 语句 。 每 一 个 都 可 以 作为 执行 
特定 的 简单 逻辑 操作 的 电路 。 在 接 下 来 的 章节 我 们 将 会 详细 分 析 语 言 结构 和 代码 。 

该 段 程序 的 图 形 表示 如 图 1-1 所 示 。3 个 连续 赋值 组 成 3 个 电路 。 它 们 之 间 
的 连接 是 通过 信号 和 端口 名 隐 式 指定 的 方法 完成 的 。 


i0 





图 1-1 比较 器 程序 的 图 示 
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1.3 基本 词汇 元 素 


标识 符 ” 标 识 符 赋予 一 个 对 象 唯一 的 名 字 ， 如 eql 、i0 RA pO, Hi E BE, Ж 
字 、 下 划 线 (_) 及 符号 ($) 组 合 。$ 通常 与 系统 任务 或 函数 一 起 使 用 。 

标识 符 的 首 个 字符 必须 是 字母 或 下 划 线 。 一 个 很 好 的 习惯 是 使 用 描述 性 的 名 
字 为 对 象 命名 。 例 如 ， 对 于 一 个 存储 器 地 址 使 能 信和 号 来 说 ，mem_addr_en 要 比 
mae 更 加 容易 理解 。 

Verilog 是 一 种 字母 大 小 写 敏感 的 语言 。 因 此 ，data-bus、Data-bus 和 DATA _ 
BUS 是 3 个 不 同 的 对 象 。 为 避免 混淆 ， 我 们 应 尽量 不 要 通过 使 用 字母 大 小 写 的 方 
式 创造 不 同 的 标识 符 。 

关键 字 关键 字 是 指 用 于 描述 语言 结构 的 预定 义 标识 符 。 本 书 中 的 Verilog 
关键 字 使 用 黑体 字 ， 比 如 示例 1.1 中 的 module 及 wire, 

间隔 符 间隔 符 在 Verilog 代码 中 用 于 分 隔 标 识 符 ,包含 空格 符 、 制 表 符 及 
换行 符 。 使 用 恰当 的 空格 符 来 安排 代码 格式 使 其 更 具有 可 读 性 。 

注释 注释 仅 用 于 记录 ， 因 而 会 被 软件 忽略 。Verilog 有 两 种 格式 的 注释 。 
单行 注释 以 /开始 ， 例 如 

// This is a comment 
多 行 注 释 封 装 在 /* 和 * /之 间 ， 例 如 
/ x This is comment line 1. 


This is comment line 2. 


This is comment line 3. ж/ 
在 本 书 中 ， 我 们 使 用 斜体 字 来 书写 注释 ， 如 上 述 的 例子 。 
1.4 数据 类 型 


1.4.1 四 值 系统 


四 种 基本 数值 适用 于 Verilog 大 部 分 数据 类 型 ; 

e 0: 表示 逻辑 0， 或 条 件 为 假 ; 

el: 表示 人 逻辑 1， 或 条 件 为 真 ; 

e Z: 表示 高 阻 态 ; 

e X: 表示 不 确定 值 。 

Z 值 相当 于 三 态 缓冲 器 的 输出 。X 值 通常 用 于 建 模 和 仿真 ， 表 示 一 种 非 0、1 
sk Z 的 值 ， 例 如 一 种 未 初始 化 的 输入 或 输出 冲突 。 
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1.4.2 数据 类 型 分 类 


Verilog 主要 有 两 种 数据 类 型 : 线 网 和 变量 。 

线 网 类 ”该 数据 类 型 表示 硬件 元 件 间 的 物理 连 线 。 用 于 作为 连续 赋值 的 输出 
及 不 同 模块 间 的 连接 信号 。 最 常 使 用 的 数据 类 型 是 wire 型 。 顾 名 思 义 ， 它 表示 
一 条 连 线 。 

wire 数据 类 型 表示 1bit 信号 ， 如 

wire pO,pl; // 两 个 1bit (F5 

当 把 信号 的 集合 划 为 一 条 总 线 时 ， 我 们 使 用 一 维 数组 (向量) 来 表示 ， 如 

wire [7:0] datal, data2; //8bit 数据 

wire [31:0] addr; //32bit Hath 

wire [0:7] revers data; // ДУЛ FR] 

索引 范围 既 可 以 降序 排列 (hn[7:0]) 也 可 升序 排列 〈 如 [0:7]) ， 前 者 使 
用 更 加 广泛 是 因为 最 左边 的 位 置 (也 就 是 第 7 位 ) 与 二 进 制 数 最 高 有 效 位 一 致 ; 

有 时 需要 使 用 二 维 数组 表示 一 个 存储 器 。 例 如 ， 一 个 32 x4 的 存储 右 〈 也 
就 是 一 个 存储 器 有 32 个 字 而 每 个 字 为 4bit 位 宽 ) 可 以 表示 为 

wire [3:0] meal [31:0];//32 3E4 FU 

线 网 类 中 男 一 些 数据 类 型 表示 特定 的 逻辑 行为 或 功能 ， 例 如 wand (JH TX 
与 连接 ) 及 supply0 (用 于 电路 接地 连接 )。 本 书 不 会 使 用 这 些 数据 类 型 。 同 时 ， 
Verilog-2001 也 允许 使 用 singed 型 ， 该 类 型 将 在 本 书 7. 3 节 讨 论 。 

变量 类 ”变量 类 中 的 数据 类 型 表示 行为 模型 中 的 抽象 存储 ， 用 于 过 程 赋值 的 
输出 。 变 量 类 包含 五 种 数据 类 型 : reg, integer, real, time 以 及 realtime。 最 常用 
的 数据 类 型 是 reg， 它 是 可 综合 的 。 推 断 出 来 的 电路 可 能 有 也 可 能 没有 物理 存储 
元 件 。 后 三 种 数据 类 型 只 在 建 模 及 仿真 中 使 用 ，integer 数据 类 型 在 本 书 7.3 节 讨 
论 。 

在 Verilog-1995 中 ， 变 量 类 就 是 我 们 所 知道 的 寄存 器 类 型 。 由 于 该 术语 与 物 
理 硬件 寄存 器 (也 就 是 触发 器 的 集合 ) 相同 ， 为 了 避免 混淆 ，Verilog-2001 文档 
中 进行 了 改变 。 在 本 书 中 ， 我 们 使 用 变量 表示 数据 类 型 ， 而 使 用 寄存 器 表示 物理 
寄存 器 电路 。 


1.4.3 数字 表示 


在 Verilog 中 ， 一 个 整 型 常数 可 以 用 多 种 格式 表示 。 通 常 的 表示 为 
[符号 ][ 位 宽 ] [基数] [数值] 

[基数 ] 指 定数 字 的 进 制 ， 可 以 为 以 下 形式 : 

e b 或 B: 二 进 制 ; 
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ө oO; 八进制 ; 

e huk Н: 十 六 进 制 ; 

e dRD: 十 进 制 。 

[数值 ] 指 定 对 应 基数 下 的 数值 。 为 了 表达 清晰 ， 数 值 中 可 以 包含 下 划 线 
(_)。[ 位 宽 ] 指 明了 数字 的 比特 位 数 ， 它 是 可 选 的 。 当 [位 宽 ] 存 在 时 ， 数 字 是 
有 具体 位 宽 限制 的 ， 否 则 无 具体 限制 。 

指定 位 宽 数字 一 个 指定 位 宽 的 数字 明确 指定 了 比特 宽度 。 除 一 些 特殊 情况 
外 ， 如 果 数 值 本 身 所 需 的 位 宽 比 [位 宽 ] 指 明 的 小 ， 就 在 前 端 填充 零 ， 用 以 扩展 
数值 。 如 果 最 高 有 效 位 是 z 或 x， 则 填充 z 或 x 值 ， 而 当 使 用 有 符号 的 数据 类 型 
时 ， 则 需要 填充 最 高 有 效 位 。 一 些 有 位 宽 数 的 范例 在 表 1-2 顶端 加 以 介绍 。 

未 指定 位 宽 数字 未 指定 位 宽 数字 省 略 了 [位 宽 ] 项 。 实 际 的 位 宽 取决 于 主 
机 但 至 少 为 32bit。 若 数值 为 十 进 制 ， 则 " [ 基数] 项 也 可 以 省 略 。 假 设 主机 使 用 
32bit 位 宽 ， 几 个 无 指定 位 宽 数字 的 例子 如 表 1-2 底部 所 示 。 

表 1-2 有 位 宽 数 和 无 位 宽 数 








数值 存储 值 备注 
5' b11010 11010 

S'bll 010 11010 忽略 
5' 032 11010 

5'hla 11010 

5' 426 11010 

5'b0 00000 拓展 o 
5'bl 00001 ИЖ o 
5'bz zzzzz 拓展 z 
5'bz XXXXX 拓展 x 
5 "bx01 xxx01 拓展 x 
-5' b00001 1111 2' s complement of 00001 
b' 11010 00000000000000000000000000011010 ”拓展 至 32bit 

' hee 00000000000000000000000011101110 ”拓展 至 32bit 

1 00000000000000000000000000000001 ”拓展 至 32bit 


=1 11111111111111111111111111111111 拓展 至 32bit 


1.4.4 运算 符 
Verilog 语言 有 二 十 多 种 运算 符 。 对 于 门 级 描述 ， 我 们 只 需 使 用 下 列 按 位 运 
TER. ~ (3). & (与 ) 1 (或 ) R^ ( 异 或 )。 这 些 运算 符 用 于 推断 基本 门 
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级 单元 。 其 他 运算 符 在 本 书 3. 2 节 讨论 。 
1.5 程序 结构 


正如 名 字 所 标明 的 ，HDL 用 于 描述 硬件 。 当 我 们 开发 或 检查 一 段 Verilog fV 
码 时 ， 如 果 我 们 以 “硬件 结构 ”来 思考 要 比 “ 按 序 算法 ”更 容易 领会 。 本 书 中 
的 大 部 分 Verilog 代码 依据 示例 1. 1 中 所 示 的 基本 架构 。 其 由 三 部 分 构成 : VO Wa 
口 声 明 、 信 号 声明 及 模块 体 。 


1.5.1 端口 声明 
示例 1. 1 中 的 模块 声明 和 端口 声明 为 


module eql 
( 
input wire 10, il, 


output wire eq 


); 

VO 声明 指明 了 方式 、 数 据 类 型 及 模块 VO 端口 名 称 。 
简化 的 语法 为 

module [ module-name | 

( 


[ mode] [ data-type] [ port-names | , 
[ mode] [ data-type] [ port-names | , 


[ mode] [ data-type] [ port-names | 

js 

[mode] 项 可 以 为 输入 型 、 输 出 型 、 或 者 输入 /输出 型 ,分 别 代 表 输 入 、 输 
出 ， 或 者 双向 端口 。 注 意 在 最 后 的 声明 后 没有 逗号 。 若 数据 wire 型 则 [ data_ 
type] 荐 可 以 省 略 。 

. Verilog-1995 端口 声明 ”在 Verilog-1995 中 ， 端 口 名 称 、 类 型 、 数 据 类 型 是 

分 别 进 行 声明 的 。 例 如 ， 前 文 所 述 的 端口 声明 应 变 为 
module eql (10, il, eq); // H#FARA MOAT 

// 声明 方式 

input iO, il; 





output eq; 
// 声明 数据 类 型 
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wire i0, 11; 
wire eq; 


在 本 书 中 我 们 不 使 用 这 种 形式 。 
1.5.2 程序 体 


在 C 语言 中 语句 是 顺序 执行 的 ， 而 与 C 语言 不 同 的 是 ， 一 个 可 综合 的 Veril- 
og 模块 可 以 认为 是 一 些 电路 的 集合 。 这 些 部 分 并 行 操作 并 发 执行 。 描 述 一 个 部 
分 可 以 有 许多 方法 : 

e 连续 赋值 ; 

e "Always №”; 

e 模块 示例 。 

描述 一 个 线路 部 件 的 第 一 种 方法 是 使 用 连续 赋值 。 这 对 简单 的 组 合 电路 很 有 
帮助 。 其 简单 表示 为 

assign | signal name | = [ expression | ; 

每 个 连续 赋值 都 可 以 认为 是 一 个 电路 部 件 。 左 手边 的 信号 为 输出 ， 而 右手 边 
表达 式 中 的 信号 为 输入 。 表 达 式 描述 了 电路 的 功能 。 例 如 语句 

assign eq =p0 | pl 
这 是 执行 逻辑 或 操作 的 电路 。 当 pO 或 pl 的 值 发 生变 化 ， 则 激活 该 条 语句 求 值 。 
在 传播 延迟 后 eq 赋 新 值 。 在 示例 1.1 中 有 三 种 连续 赋值 ， 它 们 与 图 1-1 中 的 3 
个 电路 相 一 致 。 由 于 赋值 与 3 个 电路 相 协调 ， 因 此 这 些 语句 的 顺序 不 重要 。 

描述 一 个 电路 部 件 的 第 二 种 方法 是 使 用 always 块 。 更 多 理论 的 程序 分 配 在 
always 块 内 使 用 ， 因 此 它 能 够 用 来 描述 更 加 复杂 的 电路 操作 。always 块 将 在 本 书 
3.3 节 讨 论 。 

描述 一 个 电路 部 件 的 第 三 种 方法 是 使 用 模块 例 化 。 例 化 中 创建 了 另 一 个 模块 
并 人 允许 我 们 合并 预先 写 好 的 模块 作为 当前 模块 的 子 系统 。 在 本 书 1.6 将 对 例 化 
进行 讨论 。 
1.5.3 信号 声明 


声明 部 分 指定 了 模块 使 用 的 内 部 信号 和 参数 。 内 部 信号 可 以 认为 是 电路 部 件 
间 的 互 接连 线 ， 如 图 1-1 所 示 。 
简单 的 信号 声明 句法 为 
[数据 类 型 ] [端口 名 称 ] 
示例 1. 1 中 声明 了 两 个 内 部 信号 : 
wire pO, pl; 
隐 式 线 网 ТЕ Verilog 中 ， 标 识 符 不 需要 明确 声明 。 如 果 一 个 标识 符 是 可 忽 
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略 的， 那么 它 就 被 定义 为 隐 式 线 网 。 错 误 的 数据 类 型 是 wire 型 。 我 们 可 以 移动 
示例 1. 1 中 的 外 部 声明 ， 而 简单 代码 在 示例 1. 2 中 展示 。 
示例 1.2 带 有 隐 式 线 网 的 代码 


module eql_implicit 
( 
input i0, il, // 无 数据 类 型 声明 
output eq 
)s 
// 无 内 部 信号 声明 
// RETR ALE BY ВЕ 
assign p0 = -i0 & ~il; — // 628/9 
assign pl = i0 & il; // 2626 6] 
// 两 个 乘积 项 的 和 
assign eq = pOlpl ; 
endmodule 


尽管 代码 变 得 更 加 简洁 ， 但 是 这 样 做 会 引入 标识 符 拼 写 错误 所 带 来 的 小 错 
误 ， 在 本 书 中 ,我 们 通常 使 用 外 部 声明 。 


1.5.4 其 他 例子 


我 们 可 以 将 比较 器 拓展 到 2bit 输出 。 输 入 为 a 和 b， 而 输出 为 aeqb。 当 a 和 
b 的 各 位 都 相等 时 aeqb 置 为 有 效 。 代 码 如 示例 1.3 所 示 。 
示例 1.3 2bit 比较 器 门 级 执行 


module eq2-sop 
( 
input wire [1:0] a,b, 
output wire aeqb 
s 
// 内 部 入 号 声明 
wire p0 ,pl ,p2 ,p3; 
// FEAR DY A 
assign aeqb = pO0lpl 1р21р3; 
// 乘积 项 
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assign p0 = ( -a[1]& ~ b[1]) &( -a[01&--b[0]); 

assign pl = ( -a[11& ~ b[1]) &(a(0]&b[0O]); 

assign p2 = (a[1]&b[ 1]) &( -a[0]& - b[0]) ; 

assign p3 = (a[ 1] &b[1]) &(a[0]&b[0]) ; 
endmodule 


a 和 b 端口 声明 为 两 元 素数 组 。 结 构 体 的 导出 与 1bit 比较 器 的 推导 相似 。 信 
pO. pl, p3 及 p3 代表 4 个 乘积 项 的 结果 ， 而 最 终 的 结果 apeqb 是 乘积 和 形式 
的 表达 式 。 


1.6 结构 描述 


一 个 数字 系统 通常 由 一 些 较 小 的 子 系统 构成 。 这 就 允许 我 们 用 更 简单 的 或 者 
预定 好 的 元 件 来 构建 一 个 大 的 系统 。Verilog 中 提供 了 模块 例 化 的 机 制 来 执行 此 
任务 。 这 种 类 型 的 代码 叫做 结构 描述 。 

可 选择 的 设计 一 个 1.5.4 节 中 的 2bit 比较 器 的 方法 是 利用 先前 构造 的 lbit EG 
较 器 作为 构造 块 。 图 1-2 中 ， 用 两 个 1bit 比较 器 来 检测 两 个 单独 的 bit 而 它们 的 
结果 被 反馈 为 一 个 逻辑 与 单元 。 只 有 当 bit 为 均 相 等 时 aeqb 信号 有 效 。 相 应 的 代 
码 如 示例 1. 4 所 示 。 


eq ЬО unit 





图 1-2 从 1bit 比较 器 到 2bit 比较 器 的 结构 
示例 1.4 2-bit 比较 器 的 结构 描述 


module eq2 
( 
input wire [1:0] a, b, 
output wire aeqb 
)i 
// 内 部 信号 声明 
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wire e0, el; 

// 实体 

// 例 化 两 个 1bit ERAF 

eql eq_bit0_unit (.10(а[0]),.11(Ь[0]),.еч(е0); 
eql eq_bitl_unit (.eq(el1),.i0(a[1]),.il(b[1]); 
// 者 每 位 都 相等 则 a 与 b 相等 

assign aeqb =e0 & el; 


endmodule 


代码 包含 两 个 模块 例 化 语句 。 简 单 化 的 模块 例 化 语法 为 
[模块 名 称 ] [ 例 化 名 称 ] 
( 
[端口 名 称 ] ([ 信 和 号 名 称 ] ) ， 
[端口 名 称 ]([ 信号 名 称 ] ) ， 
)s 
语句 的 第 一 部 分 指定 使 用 哪 一 个 元 件 。[ 模块 名 称 ] 指 出 模块 的 名 称 ， 而 [ 例 化 
名 称 ] 给 出 了 一 个 例 化 的 独 有 身份 。 第 二 部 分 是 端口 连接 ， 显 示 一 个 例 化 模 
块 〈 低 级 模块 ) ZO 端口 间 的 连接 及 当前 模块 (高 级 模块 ) 中 使 用 的 外 部 信 
号 。 这 种 映射 的 形式 是 依据 名 称 的 连接 。 而 端口 名 称 及 信和 号 名 称 的 顺序 没有 关 
在 示例 1.4 中 ， 第 一 条 元 件 例 化 语句 为 
eql eq_bit0_unit(.i0(a[0]),.il(b[0]),.eq(e0)); 
eql 为 示例 1. 1 中 定义 的 模块 名 称 。 端 口 映射 反映 了 图 12 中 所 示 的 连接 。 元 件 
例 化 语句 代表 了 一 个 “ 黑 盒 ”中 的 电路 ， 而 这 个 “ 黑 盒 ”的 功能 在 另 一 个 模块 
中 定义 。 
这 个 例子 证 明了 一 个 块 图 表 与 代码 间 的 紧密 联系 。 代 码 本 质 上 是 一 段 示 意图 
的 文本 描述 。 对 于 人 员 理解 一 个 图 表 来 讲 ， 这 是 种 比较 笨拙 的 方法 ， 它 是 将 所 有 
的 表示 都 放 人 一 个 单独 的 HDL 框架 中 。Xilinx ISE 包 中 含有 一 个 简单 的 示意 性 的 
编译 效用 ， 它 能 够 抓 取 图 解 形式 中 的 示意 细节 ， 然 后 将 图 表 转 换 为 一 段 HDL 结 
МЖ, 
通过 规则 列表 连接 ”联系 端口 和 外 部 信号 的 可 选择 的 方式 是 通过 规则 列表 
(有 时 也 称 为 通过 位 置 连接 )。 在 这 种 方式 中 ， 低 级 模块 的 端口 名 称 可 以 忽略 ， 
而 高 级 模块 的 信号 用 和 低级 模块 端口 定义 时 的 相同 顺序 列 出 。 通 过 这 种 方式 ， 在 
示例 1.4 中 的 两 个 模块 例 化 语句 可 以 重新 写成 
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eql eq_bit0_unit (a[0],b[0],e0); 

eql eq_bitl_unit (a[1],b[1],el); 
尽管 这 种 方法 使 得 代码 更 简洁 ， 但 是 它 可 能 会 产生 错误 ， 特 别 是 对 于 一 个 有 很 多 
LO 端口 的 模块 。 例 如 ， 如 果 我 们 更 改 低级 模块 的 代码 并 转换 端口 声明 中 两 个 端 
口 的 顺序 ， 那 么 例 化 的 模块 也 都 需要 更 正 。 如 果 在 代码 编译 期 间 发 生变 化 ， 那 么 
改变 的 端口 顺序 可 能 在 综合 时 未 被 发 现 遗 留 ， 从 而 导致 难以 发 现 的 程序 缺陷 。 

Verilog 原 语 — Veriolg 包含 一 系列 可 以 作为 模块 例 化 的 预先 设 定 的 原 语 。 这 

些 原 语 符合 简单 的 门 级 功能 ， 如 and, or 及 not 单元 。 例 如 ，eql 电路 可 以 通过 
使 用 简单 单元 实现 ， 如 图 1-3 所 示 。 相 应 的 原 语 基 本 代码 如 示例 1.5 所 示 。 





图 1-3 2bit 比较 器 低级 图 表 
示例 1.5 用 Verilog 原 语 执行 


module eql-primitive 
( 
input wire i0, il, 
output wire eq 
) 
// ARBE FY 
wire i0 n, il n, pO, pl; 
// BURT TX 4 
not unit! (i0 n, i0); //i0 п= ~ 10; 
not unit2 (il n, il); //il n- ~il; 
and unit3 (p0, i0 n, il n); //р0=10 n&il n; 
and unit4 (pl, i0, il; //pl =i0 & il; 
or unitS (eq, pO, pl); //eq-p0l pl; 
endmodule 


代码 的 该 种 格式 非常 完 长 并 且 可 以 用 简单 的 位 逻辑 运算 符 所 代替 。 在 本 书 中 
我 们 不 使 用 原 语 。 
除 预定 原 语 之 外 ， 我 们 也 可 以 定义 定制 原 语 ， 也 就 是 用 户 数据 报 协议 (UDPS). 
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例如 ， 我 们 可 以 在 一 个 UDP 中 定义 一 个 1bit 比较 器 电路 ， 如 示例 1.6 所 示 。 
示例 1.6 1bit 比较 器 用 户 数据 报 协议 


primitive eql-udp( eq, i0, il); 
output eq; 
input i0, il; 


table 
//i0 il :eq 
0 0 l 
0 1 0 
10 :0; 
I 0 1 
endtable 
endprimitive 


一 个 用 户 数据 报 协议 本 质 上 是 一 个 电路 的 表 描 述 。 同 样 的 表 也 可 以 用 一 条 
case 语句 描述 (3.5 节 讨 论 ) 。 在 本 书 中 我 们 使 用 后 面 的 方法 而 不 使 用 用 户 数据 
报 协议 。 


1.7 测试 平台 


一 旦 代码 建立 起 来 ， 就 可 以 用 主机 仿真 来 验证 一 个 电路 操作 的 正确 性 并 且 代 
码 会 被 综合 成 一 个 物理 设备 。 模 拟 是 在 相同 的 HDL 框架 中 执行 。 我 们 创造 一 种 
特殊 的 程序 testbench ， 来 模仿 一 个 物理 实验 平台 。2bit 比较 器 的 testbench 如 图 1- 
4 所 示 。 在 测试 装置 为 测试 底层 单元 ， 测 试 向 量 生成 程序 产生 测试 输入 ， 而 模拟 
器 检测 输出 应 答 。 简 单 的 2bit 比较 器 testbench 如 示例 1.7 所 示 。 





图 14 2bit 比较 器 testbench 
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示例 1.7 2bit 比较 器 testbench 


// WE (EDR BE FR AR D АСНУ [Н] FÉ fuz dee 1 ns ,时 间 步 长 为 10ps 
‘timescale 1 ns/lO ps 
module eq2-testbench ; 
// 信号 声明 
reg [1:0 ]test_in0 test. inl; 
wire test_out; 
// 测试 底层 电路 示例 
eq2 uut 
(. a(test, in0) ,. b(test inl) ,. aeqb(test out) ) ; 
// 向 量 生 成 程序 
initial 
begin 
// 测试 向 量 1 
test_in0 =2' b00; 
test inl =2' b00; 
#200; 
// 测试 向 量 2 
test inü =2' b01; 
test inl =2 ' b00; 
3200; 
// 测试 向 量 3 
test_in0 =2' b01; 
test inl =2'bl1; 
3200; 
// 测试 向 量 
test_in0 =2'bl0; 
test inl =2'bl0; 
3200; 
// 测试 向 量 5 
test_in0 =2' b10; 
test inl =2' b00; 
#200; 
// 测试 向 量 6 
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test_in0 =2'bl1; 
test inl =2'bl1; 
#200; 
// 测试 向 量 7 
test inü =2'bl1; 
test inl 22'b01 ; 
#200; 
// 结束 仿真 
$ stop; 

end 


endmodule 


代码 由 2bit 比较 器 一 段 模块 例 化 语句 和 一 个 生成 测试 模式 的 次 序 的 初始 化 块 
组 成 。 初 始 化 块 是 一 种 特殊 的 Verilog 结构 ， 在 仿真 开始 时 执行 一 次 ， 一 个 初始 
化 块 内 的 声明 语句 从 而 执行 。 每 一 个 测试 模型 由 三 条 语句 生成 ， 如 

// 测试 向 量 2 

test in0 22' b01; 

test inl =2’ b00; 

#200; 
前 两 条 语句 指定 了 test inO 和 test inl 信和 号 的 值 ， 而 第 三 条 指示 两 个 值 持续 200 
个 时 间 单 元 。 最 后 的 语句 $ stop 是 一 种 用 来 停止 仿真 ， 返 回 到 仿真 软件 控制 的 
Verilog 系统 功能 。 

代码 中 没有 监视 器 ， 我 们 能 够 在 一 种 “虚拟 逻辑 分 析 仪 ”的 仿真 显示 界面 
上 观察 输入 和 输出 波形 。testbench 的 仿真 定 时 矢量 图 如 图 2-16 所 示 。 

书写 一 段 全 面 的 测试 向 量 发 生 和 监视 的 代码 需要 详细 的 Verilog 知识 。 对 现 
在 来 讲 ， 以 上 这 有 段 清单 可 以 作为 其 他 综合 电路 的 testbench 模板 。 我 们 可 以 通过 
新 的 电路 来 代替 这 段 uut 实例 。 在 7.5 节 中 ,会 提供 有 关 附 加 的 模型 和 仿真 关联 
语言 架构 ， 同 时 示范 一 种 更 精确 的 testbench 写法 。 


1.8 文献 备注 


在 每 一 章 的 最 后 都 有 一 段 目 录 部 分 用 于 为 未 来 研究 提供 一 些 相 关 的 参考 书 
目 。 而 在 本 书 的 末尾 包含 一 个 全 面 的 目录 。 

Verilog 是 一 种 复杂 的 语言 。 在 5. Palnitkar B WJ (IEEE Standard Verilog 
Hardware Description Language, IEEE Std 1364-2011. Verilog HDL, 2nd edition) — 
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书 中 详细 说 明了 它 的 标准 ， 而 M. D. Сеш 所 著 的 《Starter ' s Guide to Verilog 
2001》 中 提供 了 详细 的 该 语言 的 语法 和 结构 。Verilog-2001 相对 于 旧 的 标准 来 说 
进行 了 许多 改进 。 由 S. Sutherland 写 的 文章 《The IEEE Verilog 1364-2001 Stand- 
ard: What's New, and Why You Need It》 则 概述 其 新 的 特征 。 编 写 一 个 大 型 数字 
系统 的 testbench 是 一 项 艰巨 的 任务 。 由 J. Bergeron 所 写 的 《Writing Testbenches : 
Functional Verijication of HDL Models, 2nd edition》 则 以 此 为 重点 进行 说 明 。 


1.9 实验 

在 每 一 章 的 结尾 部 分 都 有 一 些 练习 用 的 实验 。 这 些 实验 练习 能 够 帮助 我 们 更 
好 地 理解 相关 概念 并 提供 设计 和 调试 实际 电路 的 实用 机 会 。 
1.9.1 编码 

编写 实验 2.9. 1HDL 代码 。 在 我 们 完成 第 2 章 的 学 习 后 ， 该 段 代 码 可 以 进行 
仿真 和 综合 。 
1.9.2 二 进 制 解码 器 门 级 编码 


编写 实验 2. 9. 2HDL 代码 。 在 我 们 完成 第 2 草 的 学 习 后 ， 该 段 代 码 可 以 进行 
仿真 和 综合 。 


423€ FPGA 及 EDA 软件 概述 


2.1 简介 


开发 一 个 大 型 的 基于 FPGA 的 系统 是 一 个 繁杂 的 过 程 ， 涉 及 许多 复杂 的 转换 
和 算法 优化 。 因 此 需要 一 些 软件 工具 使 一 些 工 作 自 动 化 。 我 们 使 用 Web 版 的 
Xilinx ISE 开发 套件 进行 综合 和 实现 ， 并 使 用 Mentor Graphics ModelSim XE III 入 
门 版 来 仿真 。 本 章 中 ， 我 们 对 FPGA 器 件 及 S3 开发 板 进行 了 简要 的 介绍 ， 并 通 
过 提供 两 种 软件 包 的 简明 教程 ， 以 方便 读者 快速 进入 学 习 过 程 。 


2.2 FPGA 


2.2.1 通用 FPGA 器 件 概述 


现场 可 编程 门 阵列 (FPCA) 是 一 种 由 通用 逻辑 单元 二 维 阵列 和 可 编程 开关 
组 成 的 逻辑 器 件 。FPGA 器 件 的 基本 结构 如 图 2-1 rc. IE SERE OC E E Be Re Е 
(编程 ) 以 执行 简单 的 功能 ， 而 可 编程 开关 可 以 被 定制 ， 以 提供 对 内 部 逻辑 单元 
之 间 的 互联 。 通 过 定义 每 个 逻辑 单元 的 功能 并 有 选择 地 设置 每 个 可 编程 开关 即 可 
实现 一 个 定制 的 设计 。 完 成 了 设计 和 综合 以 后 ， 我 们 可 以 通过 简单 的 适配器 电缆 
将 期 望 的 逻辑 单元 和 开关 配置 信息 下 载 到 FPGA 器 件 中 ， 以 获得 定制 的 电路 。 由 
于 这 一 过 程 能 够 在 “现场 ”完成 ， 而 不 需要 在 制造 设备 中 进行 ， 因 此 这 种 器 件 
被 认为 是 现场 可 编程 的 。 

基于 LUT 的 逻辑 单元 一 个 逻辑 单元 通常 包含 一 个 小 的 可 配置 组 合 电路 及 
— D 触发 器 (DFF)。 实 现 可 配置 的 组 合 电路 最 通用 的 办 法 是 使 用 查找 表 
(LUT) 。 一 个 n 输 入 的 LUT 可 以 看 成 一 个 2" x1 存储 器 。 通 过 向 存储 器 写 人 恰当 
的 内 容 ， 我 们 便 可 以 通过 LUT 实现 任何 一 种 n 输入 的 组 全 逻辑 功 能 。 基 于 3 输 
入 LUT 的 逻辑 单元 结构 如 图 2-2a 所 示 。 通 过 3 输入 LUT 实现 一 个 a@Bb@e 功能 
的 示例 如 图 2-2b 所 示 。 注 意 ，LUT 的 输出 可 以 直接 使 用 或 存储 于 触发 器 中 。 后 
者 可 以 用 于 实现 时 序 电路 。 | 

宏 音 元 绝 大 多 数 FPGA 器 件 嵌 入 了 一 定 的 宏 单元 或 宏 模块 。 这 些 是 在 晶体 
管 级 设计 并 生产 的 ， 其 功能 补充 了 普通 的 逻辑 单元 。 通 常 使 用 的 宏 单元 包括 存储 
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器 块 、 组 合 乘法 器 、 时 钟 管理 电路 、1/O 接口 电路 。 高 级 FPGA 器 件 甚至 会 带 有 
一 个 或 多 个 预制 的 处 理 器 核 。 





图 2-2 基于 三 输入 LUT 的 逻辑 单元 
2.2.2 Xilinx Spartan-3 器 件 概述 


本 书 使 用 Xilinx Spartan-3 系列 FPGA 器 件 。 基 于 逻辑 单元 和 IO 数量 的 比 
率 ， 该 系列 进一步 分 为 几 个 子 系列 。 我 们 的 讨论 适用 于 全 部 子 系列 。 

ZAT, Slice 和 CLB Spartan-3 器 件 中 最 基本 的 元 件 是 逻辑 单元 (LC), 
它 是 由 一 个 4 输入 查找 表 和 一 个 D 触发 器 组 成 ， 与 图 2-2 所 示 的 相似 。 另 外 ， 一 
个 逻辑 单元 还 会 包含 一 个 用 于 实现 算数 功能 的 进位 电路 和 一 个 用 于 实现 多 路 开关 
的 多 路 开关 电路 。LUT 也 可 以 配置 为 1 个 16x1l 的 静态 随机 寻 址 存储 器 
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(SRAM) 或 一 个 16bit 的 移 位 寄存 器 。 

为 了 增加 灵活 性 同时 提高 性 能 ，8 个 逻辑 单元 通过 特殊 的 内 部 布线 结构 组 合 
了 起 来 。 在 Xilinx 的 术语 中 ， 两 个 逻辑 单元 组 成 一 个 Slice, 4 个 Slice 组 成 一 个 
可 配置 逻辑 块 (CLB), 

Жл: Spartan-3 系列 器 件 包含 4 种 类 型 的 宏 单 元 : 组 合 乘法 器 、 块 RAM, 
数字 时 钟 管理 器 (DCM) 和 LO 块 (IOB) 。 组 合 乘法 器 可 对 两 个 18bit 数据 进行 
乘积 计算 。 块 RAM 是 一 个 18k bit 同步 SRAM， 可 以 配置 成 多 种 不 同类 型 的 结 
Kj, РСМ 使 用 数据 延 时 环 以 减少 时 钟 的 偏 移 并 且 控 制 时 钟 的 频率 和 相位 偏 移 。 
IOB 控制 器 件 VO 引 脚 和 内 部 逻辑 之 间 的 数据 流 ， 通 过 配置 可 以 支持 多 种 VO 信 
号 标准 。 

Spartan-3 子 系列 中 的 器 件 ”尽管 Spartan-3 子 系列 FPGA 器 件 中 有 相似 的 逻 
辑 单 元 和 宏 单元 类 型 ， 但 它们 的 密度 是 不 同 的 。 每 个 子 系列 都 包含 一 系列 不 同 密 
度 的 器 件 。 表 2-1 中 汇总 了 Spartan-3 子 系列 中 各 个 器 件 中 LC、 块 RAM 、 乘 法 器 
和 DCM 的 数量 。 

表 2-1 Spartan-3 系列 器 件 





型 号 LC 数量 RAM 块 数量 КАМ 引 脚 模块 ”乘法 器 数量 DCM 数量 

XC3S50 1,728 4 72kbit 4 2 
ХС35200 4,320 12 216kbit 12 4 
XC38400 8,064 16 288kbit 16 4 
XC3S1000 17,280 24 432kbit 24 4 
XC3S1500 29,952 32 576kbit 32 4 
XC3S2000 46 ,080 40 720kbit 40 4 
ХС354000 62,208 96 1 ,728kbit 96 4 
XC385000 74,880 104 1 ,872kbit 104 4 


2.3 Digilent S3 开发 板 概述 


Digilent S3 开发 板 基于 Spartan-3 ЖЕ (通常 为 一 个 XC3S200 ) ， 并 带 有 一 系 
列 固定 的 外 设 。 简 化 的 版 图 如 图 2-3a 和 2-3b 所 示 。 主 要 的 元 件 和 连接 器 如 下 。 

1) Xilinx Spartan-3 XC3S200 FPGA 器 件 ( XC3S200FT256) ; 

2) 2Mbit XILINX XCFO2S platform Flash 配置 PROM; 

3) 配置 源 选 择 跳 线 ; 

4) 两 块 256kbit x 16 异步 SRAM 器 件 (1551 IS61LV25616AL-10T) ; 

5) VGA 显示 端口 ; 
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A1 Expansion Connector A2 Expansion Connector 
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b) 底板 视图 
图 2-3 S3 开发 板 板 图 


6) RS-232 串口 ; 

7) RS232 i A de ra fed s 
8) 第 二 RS-232 收发 通道 ; 

9) PS/2 鼠标 /键盘 接口 ; 
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10) 4 位 七 段 LED 显示 ; 

11) 8 个 拨 动 开关 ; 

12) 8 个 独立 的 LED 输出; 

13) 4 个 按键 开关 ; 

14) 50MHz I| at d ; 

15) BT Ph ded; 

16) FPGA 配置 模式 选择 跳 线 ; 

17) 强制 FPGA 重新 配置 按键 开关 ; 

18) FPGA 配置 成 功 指示 LED; 

19) 40 针 扩 展 连接 器 1 (标识 ВІ); 

20) 40 针 扩 展 连接 器 2 (标识 A2) ; 

21) 40 针 扩 展 连接 器 3 (标识 Al ) ; 

22) Digilent 下 载 电缆 使 用 的 JTAG 连接 器 ; 

23) Digilent 低 成 本 下 载 电 缆 〈 包 括 在 S3 套件 中 但 未 在 图 2-3 中 标识 ) ; 

24) JTAG 接口 (用 于 Xilinx Parallel Cable IV 和 MultiPRO Desktop Tool， 不 
包括 在 S3 套件 中 ) ; 

25) 非 可 调 5V 电源 连接 器 (包括 在 S3 套件 中 ) ; 

26) 供电 指示 LED; 

27) 3.3V 稳 压 器 ; 

28) 2.5V 稳 压 器 ; 

29) 1.2V 稳 压 器 ; 

30) PS2 端口 供电 电压 (3.3V 或 5V) 选择 器 。 


2.4 开发 流程 


简化 的 FPGA 系统 开发 流程 如 图 2-4 所 示 。 为 了 便于 阅读 ， 我 们 遵循 Xilinx 
文档 中 的 术语 。 流 程 图 的 左 半 部 分 是 优化 和 编程 过 程 ， 在 这 一 过 程 中 ， 系 统 由 抽 
象 的 HDL 文本 描述 转换 为 器 件 单元 级 的 配置 数据 ， 然 后 下 载 到 FPGA 器 件 中 。 
流程 图 的 右 半 部 分 是 验证 过 程 ， 检 查 设计 是 否 满 足 功能 和 性 能 要 求 。 流 程 中 的 主 
要 步骤 如 下 。 

1) 设计 系统 并 形成 HDL 文件 ， 我 们 可 能 需要 增加 一 个 单独 的 约束 文件 用 来 
指定 一 定 的 实现 约束 ; 

2) 用 硬件 描述 语言 开发 testbench 并 实施 RTL 级 仿真 ，RTL 是 指 HDL 代码 
是 在 寄存 器 传输 级 设计 完成 的 ; 

3) 进行 综合 和 实现 ， 综 合 过 程 通常 指 逻辑 综合 ， 在 这 一 过 程 中 软件 将 HDL 
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结构 转换 为 普通 的 门 级 元 件 ， 例 如 简单 逻辑 门 和 触发 器 。 实 现 过 程 包括 3 个 更 小 
的 过 程 : 转换 、 映 射 和 布局 布线 ， 转 换 过 程 将 多 个 设计 文件 合并 到 一 个 网 表 文 件 
中 ， 上 映射 过 程 通常 是 指 工艺 映射 ， 将 网 表 中 的 通用 的 门 转换 为 FPCA 的 逻辑 单元 
和 IOB， 布 局 布线 过 程 通常 是 指 通过 布局 和 布线 ， 得 到 FPGA 芯片 内 部 的 物理 版 
图 ， 这 一 过 程 中 将 逻辑 单元 放置 在 具体 的 物理 位 置 上 并 决定 连接 各 种 信号 的 走 
26, fE Xilinx 的 流程 中 ， 在 实现 过 程 的 最 后 要 执行 静态 时 序 分 析 ， 更 态 时 序 分 析 
得 出 各 种 时 序 参数 ， 例 如 最 大 传播 延 时 和 最 大 时 钟 频 率 等 ; 

















FEPGA 芯 片 


图 2-4 开发 流程 


4) 生成 并 下 载 编 程 文件 ， 在 这 一 过 程 中 会 根据 最 终 的 网 表 生 成 配置 文件 ， 
该 文件 被 串 行 下 载 到 FPGA 器 件 中 以 配置 逻辑 单元 和 开关 ， 相 应 的 物理 电路 也 会 
被 验证 。 

门 级 功能 仿真 和 时 序 仿 真 分 别 可 在 逻辑 综合 后 和 实现 后 实施 ， 这 两 个 流程 是 
可 选 的 。 门 级 功能 仿真 使 用 综合 后 的 网 表 蔡 代 RTL 描述 并 可 检查 综合 过 程 的 正 
确 性 。 时 序 仿 真 使 用 最 终 的 布局 布线 后 网 表 和 详细 的 时 序数 据 实施 仿真 。 由 于 网 
表 的 复杂 性 ， 门 级 功能 仿真 和 时 序 仿 真 需要 消耗 相当 多 的 时 间 。 如 果 我 们 遵循 良 
好 的 设计 和 编码 实践 ，HDL 代码 将 会 被 正确 地 综合 和 实现 。 我 们 只 需要 使 用 
RTL 仿真 去 检查 HDL 代码 的 正确 性 ， 并 使 用 静态 时 序 分 析 去 检查 相关 时 序 信 息 
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即 可 。 门 级 功能 仿真 和 时 序 仿真 可 以 在 开发 流程 中 略 去 
2.5 Xilinx ISE МАИ TE #7 


Xilinx ISE (集成 软件 环境 ) 用 于 控制 开发 流程 中 的 所 有 环节 。 Project Navi- 
gator 是 一 个 图 形 化 界面 ， 用 于 用 户 访问 软件 工具 和 工程 相关 文件 。 除 ModelSim 
仿真 外 ， 我 们 可 以 使 用 ISE 启动 所 有 开发 任务 。 本 节 讨 论 的 内 容 以 及 下 一 节 的 教 
程 均 基 于 ISE WebPack 8. 2 版 本 。 

默认 的 ISE 窗口 如 图 2-5 所 示 。 它 分 为 4 个子 窗口 : 


ice i WE. [Sources ff П [— — Transcript 1 


Processes 0 r Workplace fi HO 


` use -isee ,std log 
entity eq? is 


stroo arch of eqa is 
Logic? 


ftantiste two “Bit cComperatcora 
чм 0 unit: entity work.eqi|sop arch) 
t "mag (10924 (9) , 1i*»6(0), @q=>e9); 
“> tl unit: entity work.eqi(sop агов) 
Tt "map (4072411), 11-26 (1), @Qq=>el); 
aad b are equal if irdivideal bits ere equal 
<= e9-and el! 


t^ 1041 CAPS ino SOU Wt 





图 2-5 ISE 窗口 
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€ Source 窗口 (顶端 左 侧 ) : 层次 化 显示 工程 中 包含 的 文件 ; 

€ Processes 窗口 (中间 左 侧 ) : 显示 对 于 当前 选择 的 源 文件 能 够 进行 的 处 
理 ; 

€ Transcript AO Rim): 显示 状态 信息 、 错 误 和 警告 ; 

€ Workplace 窗口 (顶端 右 侧 ) : 包含 用 于 查看 和 编辑 多 个 文档 的 窗口 〈 例 
如 HDL 代码 、 报 告 、 原 理 图 等 ) 。 

每 个 子 窗口 可 被 缩放 、 移 动 、 停 靠 或 取消 停靠 。 可 以 通过 选择 VIEW 一 Re- 
store 恢复 默认 布局 。 注 意 ， 一 个 子 窗 口 可 以 包含 多 个 页 面 。 底 下 的 标签 用 于 选 
择 想 要 的 页 面 。 

Source 窗口 Source 窗口 主要 用 来 显示 与 当前 工程 相关 的 文件 。 示例 2.2 中 
的 设计 是 一 个 典型 的 Source 窗口 ， 如 图 2-6 所 示 。 项 部 的 下 拉 列 表 ， 标 签 为 
"Sources for:”， 用 于 选择 当前 的 设计 视图 。synthesis/implementation 视图 只 有 在 
我 们 使 用 ISE 进行 综合 和 实现 时 才 可 被 选择 。 


= 
әд 
@ С хс35200-56256 
& [Vf eu? (KJcode/venlog/ch02/0203 едгм) 
[ед bitü. unit- ед1 (K/code/verilog/chD2/0201 едім 
eg bitl unit- eq) (K/codejverilog/ch02/0201. едім) 
Е ед2 s3.ucf (K/code/verilog/ch02/eq?. s3.ucf) 





|g Sources | e Snapshots | (ty Libraries | 


图 2-6 Sources 窗口 


底部 有 3 个 标签 ， 分 别 为 Source 、Snapshots 和 libraries, Source 标签 显示 工 
程 的 名 字 、 指 定 的 FPGA 器 件 、 用 户 文档 以 及 设计 文件 。 模 块 会 依据 内 部 的 设计 
层次 显示 。 在 图 2-6 中 ，eq2 和 eql 实体 反映 了 示例 2.2 的 层次 结构 。eq2 模块 中 
包含 定义 了 设计 约束 的 eq_s3. ucf 文件 。 我 们 可 以 通过 双击 相应 模块 在 workplace 
中 打开 文件 。 顶 层 模块 图 标 被 放 在 模块 旁边 ， 像 eq2 模块 边 上 那样 ， 用 于 调用 对 
特定 的 模块 的 综合 和 实现 过 程 。 

Snapshots 标签 显示 了 工程 的 快照 ， 这 些 快照 是 以 前 存储 的 工程 文件 的 副本 。 
Libraries 标签 显示 了 所 有 与 工程 相关 的 库 。 

Processes HAO Processes 窗口 显示 了 可 用 的 处 理 过 程 。 该 窗口 是 环境 敏感 
的 ， 具 体 来 说 ， 窗 口中 可 以 选择 的 处 理 过 程 与 Sources 窗口 中 选择 的 源 文件 类 型 
有 关 。 例 如 图 2-6 中 ，eq2 模块 被 设 为 了 顶层 模块 并 被 选中 ， 可 以 获得 的 处 理 过 
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程 显示 于 Processes 窗口 中 ， 如 图 2-7 所 示 。 一 些 处 理 过 程 可 能 还 包含 几 个 子 处 理 
过 程 。 我 们 可 以 通过 点 击 相应 处 理 图 
标 来 开始 一 个 处 理 过 程 。ISE 采用 了 
自动 处 理 技术 ， 能 够 自动 的 运行 必要 
的 处 理 流 程 来 达到 预期 的 步骤 。 例 
如 ， 当 我 们 想 启 动 Generate Program- 
ming File 处 理 过 程 ，ISE 会 自动 调用 
Synthesize 和 Implement Design 处 理 过 
程 ， 因 为 产生 编程 文件 过 程 要 使 用 实 
现 过 程 的 结果 ， 而 实现 过 程 又 要 依靠 
综合 过 程 的 结果 。 

Transcript 窗口 ”Transcript 窗口 
用 于 显示 处 理 过 程 的 进展 情况 及 相关 
信息 。Console 页 显示 了 错误 、 警 告 和 


通知 消息 。 错 误 用 红 X 标记 在 消息 旁 ee 





边 ， 而 警告 用 黄色 ! 标记 。Warnings 
和 Errors 页 只 显示 警告 和 错误 消息 。 图 27 Processes 窗口 

Workplace 窗口 Workplace 窗口 
用 于 查看 及 编辑 各 种 文件 。 通 常 我 们 只 使 用 它 完 成 两 个 主要 工作 。 第 一 个 工作 是 
查看 和 编辑 HDL 及 约束 文件 。 默 认 的 编辑 器 是 ISE Text Editor， 这 个 简单 的 文本 
编辑 器 带 有 一 些 可 以 帮助 编写 HDL 代码 的 特性 。 第 二 个 工作 是 用 于 查看 设计 摘 
要 和 各 种 报告 。 


2.6 ISE Project Navigator 简明 教程 


Xilinx ISE 由 一 系列 软件 工具 构成 ， 然 而 对 这 些 软件 工具 使 用 的 详细 讨论 超 
出 了 本 书 的 范围 。 这 一 章节 我 们 只 提供 一 段 简 明教 程 来 阐明 基本 的 开发 过 程 。 有 
4 个 主要 步骤 : 

1) 创建 设计 工程 及 HDL 代码 ; 

2) 创建 一 个 testbench 并 执行 RTL 级 仿真 ; 

3) 添加 约束 文件 并 对 代码 进行 综合 和 实现 ; 

4) 生成 并 下 载 配置 文件 至 FPCA 器 件 中 。 

以 上 步骤 遵从 2. 4 节 中 讨论 的 一 般 开 发 流程 。 在 本 教程 中 ,我 们 使 用 在 第 1 
章 讨 论 的 2-bit 比较 器 。 代 码 如 示例 2.1 和 2.2 所 示 。 
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示例 2.1 1-bit 比较 器 的 门 级 实现 


module eql 
// VO WHA 
( 
input wire 10, il, 
output wire eq 
)i 
// f E FIBI 
wire pO, pl; 
// 程序 体 
// ПЕТНО Ж 
assign eq = pOlpl ; 
// RED 
assign pO = «i0 & ~il; 
assign pl =i0 & il; 


示例 2.2 2-bit 比较 器 的 结构 描述 


module eq2 
( 
input wire[ 1:0] a, b, 
output wire aeqb 
)i 
// 内 部 入 号 声明 
wire е0, el; 
// 程序 体 
// 例 化 两 个 1bit 比较 天 
eql eq_bit0_unit (. 10(а[0]), .il(b[0]), .eq(e0)); 
eql eq bitl unit (. eq(el), .i0(a[1]), .il(b[1])); 
// EAE AAS a Gb HAE 
assign aeqb = e0 & е1; 


endmodule 
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2.6.1 创建 工程 和 HDL 代码 


在 这 一 步骤 中 ， 有 3 项 任务 : 

e 创建 一 个 工程 ; 

e 添加 或 创建 HDL 文件 ; 

e 检查 HDL 语法 。 

创建 一 个 工程 ISE 工程 包含 一 个 设计 的 基本 信息 ， 包 括 源 文件 种 类 和 目标 
器 件 。 可 以 按 如 下 步骤 创建 一 个 新 工程 。 

1) 选择 Start—All Programs 一 Xilinx ISE— Project Navigator (或 者 存放 ISE 的 
位 置 ) 来 启动 ISE project navigator; 

2) 在 Project Navigator 中 ， 选 择 File—New Project， 弹 出 New Project Wizard 

- Create New project 对 话 窗 ， 输 入 工程 名 称 (如 eq2) 及 位 置 ， 并 确认 Top-level 
Source Type 区 域 中 选择 的 是 HDL， 单 击 “ Next”; 

3) 出 现 The New Project Wizard-Device Properties dialog 对 话 框 ， 我 们 需要 选 
择 该 对 话 框 中 的 目标 器 件 ， 可 在 FPGA 开发 板 手册 中 或 FPGA 芯片 顶部 的 标记 找 
到 该 信息 ， 对 于 一 个 典型 的 S3 开发 板 ， 选 择 如 下 : 

€ Product Category: All; 

€ Family; Spartan3; 

€ Device: XC3S200; 

€ Package: FT256; 

€ Speed: -4, 我们 还 需要 确认 一 下 是 否 选择 了 Xilinx XST 软件 用 于 综合 ; 

€ Synthesis Tool; XST ( VHDL/ Verilog) ; 

4) 多 次 单 击 “ Next” 按 钮 ， 完 成 余下 的 对 话 框 ， 之 后 单 击 “ Finish” 来 完 
成 创建 工程 。 

一 个 工程 创建 之 后 ， 我 们 可 以 创建 或 添加 HDL 文件 和 约束 文件 。 

创建 一 个 新 的 HDL 文件 ”如果 文 件 不 存在 ， 我 们 就 必须 创建 一 个 新 的 源 文 
件 。 创 建 一 个 新 的 HDL 文件 的 过 程 如 下 。 

1) 选择 Project 一 New Source， 出 现 The New Source Wizard-Select Source Type 
dialog 对 话 框 ， 选 择 Verilog Module 并 输入 文件 名 称 eq2 ， 单 击 “Next”; 

2) 出 现下 一 个 对 话 框 ， 该 对 话 框 允许 我 们 输入 骨 入 到 Verilog 代码 中 的 端口 
名 称 ， 然 而 ， 由 于 自动 生成 的 代码 使 用 了 旧 的 端口 声明 风格 ， 因 此 我 们 不 使 用 该 
FEE, Haly "Next"; 

3) #1 "Finish", 一 个 新 的 HDL 文本 编辑 窗口 便 出 现在 Workplace 窗口 
中 ， 同 时 软件 自动 生成 了 一 段 注释 标题 和 模块 分 隔 符 ; 

4) 使 用 编辑 器 输入 示例 2. 2 中 的 HDL 代码 并 保存 文件 ; 
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5) 重复 以 上 步骤 来 创建 另 一 个 示例 2. 1 中 的 文件 。 

添加 已 有 文件 ”如果 一 个 文件 已 经 存在 ， 则 可 以 按照 如 下 步骤 添加 到 工程 
B. 

1) 选择 Project—Add Source， 出 现 一 个 对 话 窗 口 ; 

2) 转 到 适当 的 目录 并 选择 目标 文件 ， 单 击 “Open”， 出 现 一 个 新 的 对 话 框 ; 

3) 单 击 “OK” 完 成 添加 ， 这 些 文件 此 时 便 出 现在 了 Project Navigator 的 
Sources 窗口 中 。 

检查 代码 语法 ”完成 一 个 新 的 HDL 文件 后 ， 我 们 需要 检查 代码 语法 。 

1) 在 Source 窗口 中 选择 目标 文件 ; 

2) 在 Processes 窗口 中 ， 单 击 Synthesize 附近 的 “ +” 图 标 展开 处 理 层 次 ; 

3) 双击 “Check Syntax process”, 

底部 的 transcript 显示 了 处 理 的 进展 情况 并 报告 错误 和 和 警告， 分 别 以 红色 X 
和 黄色 ! 为 开头 标记 。 双 击 这 些 信 息 会 转 到 文件 中 的 错误 行 。 我 们 可 修改 问题 ， 
保存 文件 ， 并 重复 语法 检查 过 程 直到 消除 所 有 语法 错误 。 


2.6.2 创建 Testbench 及 执行 RTL 仿真 


Testbench 的 功能 就 像 一 个 虚拟 的 试验 平台 。 它 包括 被 测试 的 HDL 模块 和 用 
来 产生 激励 的 代码 。RTL 仿真 在 计算 机 中 验证 HDL 模块 的 操作 。ISE 包含 一 个 
内 置 的 JSE 仿真 器 ， 也 可 以 调用 Mentor Graphics 公司 的 ModelSim 仿真 器 。 因 为 
后 者 更 加 稳定 和 通用 ， 因 此 本 书 中 我 们 使 用 ModelSim 仿真 器 。 尽 管 ModelSim 能 
够 从 ISE Project Navigator 中 调动 ， 我 们 还 是 把 它 作为 独立 的 软件 工具 ， 并 在 2.7 
节 中 进行 说 明 。 


2.6.3 添加 约束 文件 综合 和 实现 代码 


这 一 步骤 有 3 个 任务 : 

e 添加 约束 文件 ; 

e 执行 综合 和 实现 ; 

e 检查 设计 摘要 。 

添加 约束 文件 ”约束 包括 综合 和 实现 过 程 的 限制 条 件 。 主 要 的 约束 类 型 是 
对 顶层 O 引 脚 的 分 配 和 最 小 时 钟 速率 的 设置 。 在 实现 过 程 中 ,顶层 模块 的 
0 信和 号 必须 被 映射 到 FPGA 器 件 的 物理 引 脚 上 。 由 于 外 围 接口 的 VO 信和 号 已 经 
在 开发 板 上 与 指定 的 FPGA 引 脚 永久 相连 ， 我 们 必须 保证 信号 映射 到 对 应 的 引 
脚 上 。 另 一 种 约束 的 类 型 是 关于 时 序 的 ， 它 指定 了 最 小 时 钟 频 率 以 便于 使 用 板 
上 的 晶振 。 

约束 信息 存储 在 扩展 名 为 . ucf 的 文本 文件 中 (用 户 约束 文件 ) 。 在 eq2 的 电 
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路 中 ， 我 们 将 a 和 端口 连接 到 4 个 开关 上 ，aeqb 端口 连 到 LED 上 以 验证 电路 
的 物理 操作 。 对 于 53 板 ， 对 应 的 引 脚 是 F12. CI2, H14, НІЗ 和 K12。 约 束 文 
TEN 

# 4slideswitches 

NET "a<O>" LOC ="F12" ; # switchO 

NET "a«1»" LOC ="G12" ; # switchl 

NET "b «0»" LOC -"HI4" ; # switch2 

NET "Ь<1>" LOC = "НІЗ" ; # switch3 

# led 

NET "aeqb" LOC ="K12" ; # ledO 

# 用 于 注释 ， 在 该 符号 之 后 的 文本 是 可 被 忽略 的 。 这 个 文件 必须 在 Source 窗 
口 添 加 到 设计 中 。 

有 一 些 ISE 工具 可 以 用 来 设置 和 产生 约束 文件 。 由 于 我 们 的 实验 都 是 在 相同 
的 原型 板 中 做 的 ， 因 此 约束 (例如 引 脚 分 配 和 时 钟 频 率 ) 也 保持 不 变 。 附 录 中 
提供 了 包含 3 板 中 所 有 连接 的 外 围 接 口 信和 号 的 约束 文件 模板 。 创 建 约束 文件 的 
一 个 简单 的 办 法 是 根据 当前 设计 的 LAO 端口 名 称 复制 和 编辑 模板 。 为 eq2 电路 创 
建 . ucf 文件 的 过 程 如 下 。 

1) 复制 模板 中 的 约束 文件 并 重 命名 为 eq2_s3. ucf; 

2) 在 Source 窗口 中 按照 2.6.1 节 中 的 过 程 为 eq2 模块 添加 新 的 约束 文件 ; 

3) 选 定 约束 文件 ; 

4) 在 Processes 窗口 中 ， 单 击 User Constraints 旁边 的 “ +” 图标， 展开 处 理 
的 层次 ; 

5) 双击 “Edit Constrains (Text) ”过 程 启 动 ISE 文本 编辑 器 ; 

6) 根据 需要 重 命名 VO 名 字 ， 然 后 删除 无 用 的 引 脚 分配 ; 

7) 保存 文件 。 

ISE 8. 2 版 本 的 默认 选项 只 允许 对 已 有 的 顶层 LO 端口 进行 引 脚 分 配 。 如 果 
没有 从 ucf 模板 中 删除 无 用 的 引 脚 分 配 ， 则 会 产生 错误 提示 。 我 们 可 以 用 如 下 方 
式 履 盖 默 认 的 选项 。 

1) 选择 项 层 HDL 文件 ; 

2) 在 Processes 窗口 中 鼠标 右键 单 击 “Implement Design” 过 程 ， 在 菜单 中 
选择 “Properties. . . ”， 会 出 现 一 个 对 话 框 ; 

3) 在 对 话 框 中 在 “Allow Unmatched LOC Constraints” 选 项 处 打 勾 ， 单 击 
“DK” 

当 这 个 选项 打开 后 ， 我 们 可 以 使 用 相同 的 uef 模板 用 于 所 有 的 设计 ， 只 要 项 
层 模 块 中 的 LO 端口 名 称 是 相同 的 ， 无 需 每 次 编辑 ucf 文件 。 


第 2 章 FPGA 及 EDA 软件 概述 “ 31 - 





执行 综合 和 实现 ”调用 综合 和 实现 过 程 非常 简单 : 

1) 选择 要 被 综合 的 模块 并 确认 它 被 指定 为 设计 的 顶层 模块 〈 在 该 模块 图 标 
旁 带 有 一 个 绿色 的 方块 ) ; 

2) 在 Processes 窗口 中 双击 “Implement Design” 过 程 ; 

3) 尽管 之 前 进行 过 语法 检查 ， 代 码 中 仍 可 能 包含 一 些 无 法 被 综合 或 不 利于 
实现 的 结构 (例如 组 合 逻辑 反馈 环 ) ， 错 误 和 警告 信息 被 显示 在 transcript 窗口 中 
的 console 标签 内 ; 

4) 更 正 问题 并 重复 仿真 和 综合 的 过 程 。 

检查 设计 摘要 ” 随 着 工程 的 推进 ， 在 每 个 过 程 中 都 会 产生 报告 。 这 些 报告 和 
关键 的 统计 数据 会 显示 在 design summary 窗口 中 。 我 们 可 以 检查 形成 的 电路 大 小 
(包括 slices 数 、 触 发 器 个 数 和 查找 表 个 数 ) 。 对 于 时 序 电路 ， 检 查 时 钟 频率 是 否 
满足 时 序 约束 。 该 摘要 可 以 通过 在 Processes 窗口 中 双击 “View Design Summary” 
过 程 来 查看 。eq2 电路 的 设计 摘要 如 图 2-8 所 示 。 我 们 可 以 在 “Device Utilization 
Summary” 部 分 查看 slice, LUT 等 资源 的 使 用 。 更 详细 的 报告 可 以 通过 点 击 相 应 
的 链接 来 查看 。 


2.6.4 生成 并 下 载 配置 文件 至 ЕРСА 4] 


最 后 一 步 是 生成 配置 文件 并 下 载 到 FPGA 器 件 中 。 该 步骤 中 有 3 个 任务 : 

e 连接 下 载 线 ; | 

e 产生 配置 文件 ; 

e 下 载 配置 文件 ; 

53 开发 套件 带 有 一 个 并 口 JTAG 下 载 线 ， 后 面 的 讨论 就 是 基于 此 下 载 线 。 其 
他 下 载 线 的 使 用 过 程 与 之 类 似 ， 在 使 用 手册 中 有 详细 的 说 明 。 

连接 下 载 线 ”将 开发 板 做 如 下 准备 : 

1) 确认 PROM 和 配置 模式 跳 线 (图 2-3 中 标识 为 3 和 16) 为 默认 设置 ; 

2) 连接 电源 线 ; 

3) 连接 下 载 线 的 一 端 到 PC 的 并 口 ， 连 接 男 一 端 到 S3 板 的 JTAG 接口 (图 
2-3 标识 为 22)。 

生成 配置 文件 ”生成 配置 文件 非常 简单 : 

1) 确认 在 Source 窗口 中 选中 顶层 模块 ; 

2) 在 Processes 窗口 中 点 击 “Generate Programming File”。 

完成 这 步 后 配置 文件 eq2. bit 便 产 生 了 。 

下 载 配 置 文 件 ”下载 配置 文件 到 FPGA 器 件 中 是 通过 软件 工具 iMPACT 完成 
的 ， 可 以 从 ISE Project Navigator 中 调用 。 过 程 如 下 。 

1) 在 Processes 窗口 单 击 “ + ”展开 “Generate Programming File” iff; 


32. 用 Verilog 设计 FPGA 样机 实例 解析 (Xilinx Spartan-3 版 ) 












2 leqzise | Placed and Routed 1 





| Module Name: eq? |  *Emor:  — NoErrors 
| | Target Device: xc3s200-5ft256 I . Wernings: ú Ë T No Warnings | 
| Product Version: ISE. 8.1) | + Updated: | Sun Jen 21 18:04 45 2007 





























| Logic Utilization | | 

| Number of 4 input LUTs | | | m 41 | 1% — | 

[Logic Distribution ubi [ I - I | 

| Number of occupied Slices m | 1 1,920 | 1% | E 

| Number of Slices containing only related logic | 1 1| 100% | 

[Number of Slices containing unrelated logic | 0 | 1 | | D% Е 

| Total Number of 4 input LUTs CN 1| 3840 | 1% | 

{Number of bonded QBs — | 5 з ?W* 

| Total equivalent gate count for design - | I 5 6 | c = | ow — | 

Ч | 





| Additional JTAG gate count for IOBs а І | | 























| 
| Synthesis Report [Curent — |SetJan20222232200 0 о Ш | 
| Translation Report | Current | Sat Jan 20 2222462007 0 fo jo | 
ch Шы eem на и н 
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图 2-8 设计 摘要 

2) 双击 “Configure Device (IMPACT)” 过 程 ， 出 现 iMPACT 的 欢迎 界面 ， 
如 图 2-9 所 示 ， 使 用 边界 扫描 (JTAG) 检查 配置 器 件 ， 并 核实 已 自动 连接 至 下 
载 线 ， 同 时 确认 在 下 拉 列 表 中 已 选择 Automatically connect to a cable and identify 
Boundary-Scan chain 选项 ， 单 击 “Finish”; 

3) 如 果 消 息 显 示 发 现 两 个 器 件 ， 则 单 击 “OK” 继 续 ; 

4) iMPACT ŁA ПЯ “Assign New Configuration File" 对 话 框 同 时 出 现 ， 如 
图 2-10 所 示 ， 板 子 上 连接 到 JTAG 链 的 器 件 应 被 检测 并 显示 出 来 ; 


5) 选择 eq2. bit 文件 并 单 击 “Open”， 将 配置 文件 指派 到 JTAG 链 上 的 
хс35200 F; 
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6) 如 果 出 现 警 告 信息 ， 则 忽略 并 单 击 “OK ; 

7) 选择 Bypass ЖУА; 

8) 右 击 xe3s200 AEF ORR, 15 “Program...” , Programming Properties 对 
话 框 被 打开 ， 单 击 “OK” 对 器 件 进行 编程 ; 

9) 当下 载 过 程 完成 时 会 出 现 Program Succeeded 信息 。 

现在 FPGA 器 件 已 经 被 配置 ， 我 们 可 以 通过 开关 来 测试 电路 ， 观 察 LED 输出 。 

另外 一 种 配置 FPGA 的 方式 是 将 配置 文件 下 载 到 PROM 中 并 且 从 PROM 中 加 
载 配置 文件 。 更 多 信息 可 以 在 文献 备注 章节 所 引用 的 资料 中 找到 。 


2.7 Modelsim HDL 仿真 器 简明 教程 


ModelSim 软件 是 Mentor Graphics 公司 的 HDL 仿真 器 ， 能 够 独立 于 ISE 运行 。 
本 节 的 讨论 基于 ModelSim XE Ill 6. 0d 入 门 版 。 

默认 的 ModelSim 窗口 如 图 2-11 所 示 ， 它 分 为 3 个 子 窗口 : Transcript 窗口 (下 
WB), Workspace 窗口 和 多 文档 界面 (MDI), Workspace 窗口 显示 当前 处 理 的 信息 。 
底部 的 标签 用 于 选择 想 要 的 过 程 页 面 ， 可 以 选择 Project, Library, Sim 等 。 


标签 : Transcript 11 
` 





озне omo a 


T 


~ i] XOX |) АЖ! 








图 2-11 典型 的 ModelSim 窗口 
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Transcript 窗口 用 于 跟踪 命令 历史 记录 和 信息 ， 也 可 以 作为 命令 行 接口 输入 
ModelSim 的 命令 。MDI 窗口 用 于 显示 HDL 文本 、 波 形 等 。 下 面 的 标签 用 于 选择 
想 要 的 页 面 。 

每 个 子 窗口 可 以 缩放 、 移 动 、 停 靠 或 取消 停靠 。 另 外 一 些 窗 口 可 以 用 于 一 些 
其 他 操作 。 可 以 通过 选择 Window—Initial Layout 来 恢复 默认 界面 。 

本 节 中 ,我们 通过 给 出 简明 教程 来 说 明基 本 的 仿真 过 程 ， 包 括 3 ЖР: 

1) 准备 仿真 工程 ; 

2) 编译 HDL 代码 ; 

3) 执行 仿真 并 检查 波形 。 

我 们 使 用 第 1 章 的 2 输入 比较 器 ， 代 码 在 示例 2. 3 中 给 出 。 

示例 2.3 2bit 比较 器 的 testbench 


// LIEBER D IRE IR A Ins ,时 间 步 长 为 10ps 
“timescale 1 ns/10 ps 
module eq2_testbench; 
// 978] 
reg [1:0] test. inO, test inl; 
wire test. out ; 
// DUBAI НА pz ffl 
eq2 uut 
(. a(test in0) , . b(test inl) , . aeqb(test out) ) ; 
// 向 最 生成 程序 
initial 
begin 
// 测试 向 量 1 
test_in0 =2’ b00; 
test inl =2’ b00; 
#200 ; 
// 测试 向 量 2 
test_in0 =2 b01; 
test. inl =2’ b00; 
3200; 
// 测试 向 量 3 
test_in0 =2’ b01; 
test inl =2’ bll; 


“36. 用 Verilog 设计 FPGA 样机 实例 解析 (Xilinx Spartan-3 版 ) 





#200; 
// 测试 向 量 4 
test in0 22' b10; 
test inl 22' bl0; 
#200; 
// 测试 向 量 5 
test_in0 =2’ b10; 
test inl =2’ b00; 
#200; 
// 测试 向 量 6 
test_in0 22' bll; 
test inl =2 bll; 
#200; 
// 测试 向 量 7 
test_in0 =2 b11; 
test. inl =2”Ь01; 
#200; 
// 结束 仿真 
$ stop; 
end 


endmodule 


准备 仿真 工程 ”ModelSim 仿真 工程 包括 仿真 库 和 HDL 文件 。Testbench 是 一 
种 HDL 程序 ， 它 能 够 像 我 们 在 2. 6. 1 节 中 讨论 的 那样 使 用 ISE 文本 编辑 器 创建 。 
另外 ，ModelSim 也 自 带 了 编辑 器 。 我 们 假设 所 有 的 HDL 文件 都 已 构建 完毕 。 创 
建 一 个 工程 的 过 程 如 下 。 

1) 选择 开始 一 所 有 程序 一 ModelSim XE Ш 6.0d—ModelSim (或 者 ModelSim 
存放 的 地 方 ) 启动 ModelSim 程序 ; 

2) 选择 File 一 New 一 Project， 出 现 创 建 工 程 对 话 框 Create Project， 如 图 2-12a 
所 示 ， 输 入 工程 名 eq_ testbench， 选 择 工程 位 置 ， 设置 Default Library Name 为 
work, т “OK”, 在 主 窗口 中 出 现 一 个 空 的 工程 页 面 ， 出 现 添加 项 目 至 工程 窗 
口 ， 如 图 2-12b 所 示 。 

3) 在 添加 项 目 至 工程 窗口 中 单 击 “Add Existing File”， 添 加 所 需 的 HDL X 
fF, Ht; "OK", Æ Workplace 子 窗口 中 出 现 工程 标签 并 显示 出 已 选 文 件 ， 如 图 
2-13 TAN. 
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-|Create Project x | Add items to the Project X 
=i Сре on the icon to add tems ОП уре — ` 


leq testbench 


a 


Project Location = Creme New Pile Add É ustuna File 
[/texivhdl ch tpga/modelSim Browse... 


. Default Library Name 


work 


i Create Simulation Create New Folder 


z Close | 


a) 创建 工程 对 话 框 b) 添加 项 对 话 框 


图 2-12 新 工程 对 话 框 

编译 HDL 代码 这 里 的 编译 是 指 将 HDL 代码 转换 为 ModelSim — 
以 Verilog 为 例 ， 编 译 以 模块 为 基础 。 M 
其 过 程 如 下 。 | Мейоз 0 | 07/08/07 02:11 | 

Du 亮 显示 eql 文件 并 右 击 R| | Í agew n > Verilog 1 23 11/17/07 02:55 
fs, 选择 Compile — Compile Selected , m eu UT Саш " 
注意 编译 应 从 设计 的 底层 模块 开始 ， 
编译 过 程 和 信息 在 transcript 窗口 中 显 ,| | d 
示 ; | iti Project Д Uray | G sim | 8 Fies | B mem” 

у бынын ja S sss susu sal 
РАЈ, SUA Gm X, 5d 图 2-13 Workplace 面板 的 Project 标签 
transcrit 窗口 中 的 红色 错误 行 可 定位 错误 ， 修 正 问题 ， 保 存 文件 并 重新 编译 文件 ; 

3) 重复 上 述 过 程 步骤 ,将 eq2 文件 和 ed_ 也 文件 编译 。 

执行 仿真 并 检查 波形 ”在 编译 好 testbench 和 相应 文件 后 ， 我 们 可 以 执行 仿 
真 并 检查 结果 波形 。 这 相当 于 在 虚拟 实验 环境 下 运行 电路 并 在 虚拟 逻辑 分 析 仪 中 
检查 波形 。 过 程 如 下 : 

1) 选择 Simulate 一 >Start Simulation ， 出 现 仿 真 窗口 ; 

2) 在 Design 标签 中 ， 找 到 我 们 创建 的 work 库 ， 并 展开 ， 会 显示 出 所 有 编 
译 的 单元 ， 如 图 2-14 所 示 。 

3) 通过 双击 相应 的 图 标 载 人 eq2-testbench， 在 工作 区 窗口 中 出 现 sim 标签 
并 显示 eq2-testbench 的 结构 ， 如 图 2-15 所 示 ，object 窗口 中 会 显示 选中 模块 所 包 
含 的 信号 

4) 选中 uut 单元 并 右 击 鼠 标 ， 选 择 Add— Add to Wave， 会 把 所 有 uut 单元 
的 信号 都 加 入 到 波形 页 面 ， 波 形 页 面 会 出 现在 MDI 窗口 中 ; 

5) 如 果 有 必要 ， 则 重新 安排 信号 的 顺序 并 设置 适当 的 格式 〈 十 进 制 、 十 六 
进 制 等 ) ; 
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6) 选择 Simulate 一 Run， 有 几 个 命令 用 来 控制 仿真 : Restart ( 重 置 仿真 )， 
Run (运行 一 步 仿 真 ) Continue run (从 中 断 中 恢复 运行 )，Run All (连续 运行 
仿真 ) Break (中 断 仿 真 ) ， 这 些 命令 在 顶层 窗口 中 也 会 以 图 标 方式 显示 ; 

7) 波形 窗口 显示 仿真 结果 ， 如 图 2-16 所 示 。 我 们 可 以 滚动 窗口 ， 放 大 、 缩 
小 检查 设计 的 正确 性 。 


Start Simulation 


work Library work 
i eq! Module — K/code/venlog/ch02/eq] v 
| ij eq? Module K. /code/venlog/ch02/eq2 v 
ЦМ) eq2_testbench Module — K/code/verilog/ch02/eq tb.v 
$MODEL, TECH/ /vital2000 


$MODEL_TECH/ /ieee 


$MODEL_TECH/ ./modelsim_lit 








图 2-14 ”仿真 对 话 框 















Minstence _ jpasignun [Design ur “| ， 
344 eq2_testbenct eq? testb Module 
>й uut еа? Module 
F M en bit) unit eq! Module 
| Qd eq tu unit egi Module 
Ф #ASSIGN#I? eq? Process | 
1—  ! -4 Ti 
[Bere у | oe [E ne Гане 























图 2-16 ”波形 窗口 
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2.8 文献 备注 


Xilinx ISE 和 Mentor Graphics ModelSim 都 是 复杂 的 软件 包 ， 它 们 的 文档 超过 
数 千 页 。 大 多 数 的 文档 都 可 以 通过 Help 菜单 访问 。ISE 有 一 个 30 页 的 简明 教程 
(ISE 8. li Quick Start Tutorial》， 更 详细 的 170 页 的 教程 是 《ISE In-Depth Tutori- 
al》。Modelsim 也 有 类 似 的 教程 ModelSim Tutorial。 这 些 教程 提供 了 关于 软件 包 的 
所 有 特点 的 概述 。Spartan-3 器 件 的 相关 信息 可 以 从 它 的 数据 手册 DS099《 Spar- 
tan-3 FPGA Family; Complete Data Sheet》 中 找到 ， 包含 了 对 逻辑 单元 和 宏 单 元 的 
详细 解释 。Clive Maxfield ff) (Design Warrior’ s Guide to FPGAs) Xf FPGA 的 相关 
问题 进行 了 全 面 的 概述 。S3 开发 板 的 详细 板 图 和 L/O 连接 器 可 以 在 《Spartan-3 
Starter Kit Board User Cuide》 中 找到 。 其 他 开发 板 的 相关 信息 可 以 在 其 手册 中 找 
到 。 


2.9 实验 


2.9.1 门 级 大 于 电路 


大 于 电路 比较 两 个 输入 a 和 b， 当 a 大 于 b 时 ， 置 输出 有 效 。 我 们 希望 仅 用 
门 级 逻辑 运算 符 自 底 向 上 创建 一 个 4bit 大 于 电路 。 按 如 下 步骤 设计 电路 。 

1) 推导 出 2bit 大 于 电路 的 真 值 表 ， 并 得 到 乘 加 形式 的 逻辑 表达 式 ， 基 于 该 
表达 式 ， 只 使 用 逻辑 运算 形成 HDL 代码 ; 

2) 为 2bit 大 于 电路 设计 testbench ， 执 行 仿真 并 验证 设计 的 正确 性 ; 

3) 使 用 4 个 开关 作为 输入 ，1 个 LED 作为 输出 。 综 合 电 路 并 下 载 配置 文件 
到 开发 板 中 ， 验 证 电路 的 运行 ; 

4) 使 用 2bit 大 于 电路 和 2bit 等 于 比较 器 以 及 最 少 的 “ 胶 连 门 ”来 构建 4bit 
大 于 电路 ， 先 画 出 框图 并 根据 框图 得 出 结构 级 HDL 代码 ; 

5) 为 4bit 大 于 电路 设计 testhench ， 执 行 仿真 并 验证 设计 的 正确 性 ; 

6) 使 用 8 个 开关 作为 输入 ，1 个 LED 作为 输出 ， 综 合 电 路 并 下 载 配置 文件 
到 开发 板 中 ， 验 证 其 功能 。 


2.9.2 门 级 二 进 制 译 码 器 


поо 二进制 译 码 器 可 根据 输入 组 全 设 定 2" 位 输出 。 一 个 带 使 能 信号 的 
2:4 译 码 器 的 真 什 表 见 表 22。 我 们 想 使 用 门 级 逻辑 运算 符 来 创建 译 码 器 。 过 程 
如 下 : 
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1) 确定 带 使 能 的 2:4 译 码 器 的 逻辑 表达 式 ， 使 用 逻辑 运算 符 形 成 HDL ft 
码 ; 
2) 为 译 码 器 设计 testbench， 执 行 仿真 并 验证 设计 的 正确 性 ; 
3) 使 用 两 个 开关 作为 输入 ，4 LED 作为 输出 ,综合 电路 并 下 载 配 置 文件 
至 开发 板 中 ， 验 证 其 功能 ; 
4) 用 2:4 译 码 器 推导 出 3: 8 译 码 器 ， 首 先 画 出 框图 并 根据 框图 得 到 结构 
HDL 代码 ; 
5) 为 3: 8 译 码 器 设计 testbench， 执 行 仿真 并 验证 设计 的 正确 性 ; 
6) 使 用 3 个 开关 作为 输入 ，8 个 LED 作为 输出 ， 综 合 电 路 并 下 载 配置 文件 
至 原型 板 中 ， 验 证 其 功能 ; 
7) 用 2:4 译 码 器 推导 出 4: 16 译 码 器 ， 首 先 画 出 框图 并 根据 框图 得 到 结构 级 
HDL 代码 ; 
8) 为 4:16 译 码 器 设计 testbench， 执 行 仿真 并 验证 设计 的 正确 性 。 
42-2. 带 使 能 2:4 译 码 器 真 值 表 





输入 输出 
使 能 a(1) a(0) b 代码 
1 一 一 0 0 0 0 
1 0 0 0 0 0 1 
1 0 1 0 0 1 0 
1 1 0 0 l 0 0 
1 1 1 1 0 0 0 
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3.1 引言 


第 1 章 介绍 了 利用 简单 的 按 位 运算 符 来 描述 门 级 电路 设计 ， 门 级 电路 均 由 简 
单 的 逻辑 单元 构成 。 本 章 中 ,我 们 将 考查 用 HDL 描述 由 中 规模 元 件 组 成 的 电路 ， 
如 加 法 器 、 比 较 器 和 乘法 器 等 。 由 于 这 些 组 件 是 寄存 器 传输 方法 学 中 使 用 的 基本 
构成 块 ， 因 此 很 多 时 候 称 之 为 RTL 级 设计 。 我 们 会 介绍 更 复杂 一 些 的 Verilog ië 
算 符 、always 块 、 布 线 结构 ， 并 通过 一 系列 的 示例 说 明 RTL 级 组 合 逻 辑 电 路 的 
设计 。 
3.2 运算 符 

Verilog 包含 约 24 个 运算 符 ， 见 表 3-1。 除 在 第 1 章 中 介绍 的 按 位 运算 符 ， 
还 有 算术 、 移 位 和 关系 运算 符 。 这 些 运 算 符 对 应 中 规模 元 件 ， 如 加 法 器 和 比较 
器 。 我 们 将 在 这 一 章节 介绍 这 些 运算 符 ， 同 时 还 包括 多 种 与 综合 相关 的 Verilog 


结构 。 


表 3-1 Verilog 运算 符 汇总 
































运算 符 类 型 运算 符 标识 说 明 操作 目 数 
+ 加 法 2 
- 减法 2 
* 乘法 2 
算术 运算 符 
£ 除法 2 
% 取 模 2 
жж SRE 2 
>> BAB 2 
<< PHE 2 
移 位 运算 符 
>>> 算术 右 移 2 
<<< 算术 左 移 2 
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(Ж) 
运算 符 类 型 运算 符 标识 i te fe AR 
2 
2 
关系 运算 符 
2 
2 
2 
相等 运算 符 P 
2 
= 按 位 非 1 
& 按 位 与 2 
按 位 运算 符 
| 按 位 或 2 
š 按 位 异 或 2 
& 归 约 与 1 
规约 运算 符 l 归 约 或 l 
归 约 异 或 1 
RAE 1 
逻辑 运算 符 逻辑 与 2 
逻辑 或 2 
z 连接 任意 
连接 运算 符 
复制 任意 











条 件 运算 符 条 件 


3.2.1 算术 运算 符 


算术 运算 符 共 包括 6 个 : +, -. ж. Z.% 和 **， 分 别 为 加 、 减 、 乘 、 
除 、 取 模 及 求 寡 操 作 。 加 、 减 运算 符 同 时 也 可 用 于 单 目 操作 中 ， 如 -a; 在 综合 
过 程 中 ，+ 、- 运 算 符 会 被 推断 为 加 法 器 和 减法 器 ， 而 这 些 加 减法 器 是 由 FPGA 
内 部 的 基本 逻辑 单元 综合 而 成 。 

乘法 是 一 种 复杂 的 操作 ， 对 乘法 运算 符 * 的 综合 取决 于 综合 工具 软件 和 目标 
器 件 工艺 。 
Xilinx Spartan-3 FPGA 包含 预制 的 组 合 逻 辑 乘法 器 模块 。Xilinx 的 综合 工具 软件 
XST 能 在 综合 过 程 中 推断 出 乘法 模块 ， 这 样 ， 乘 法 运算 符 可 以 应 用 于 HDL 代码 中 。 
S3 开发 板 上 面 的 XCS200 FPGA 包含 了 12 个 18 x 18 的 乘法 单元 。 虽 然 ， 乘 法 运算 
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符 是 支持 综合 的 ， 但 我 们 在 使 用 时 仍 要 注意 乘法 模块 输入 数据 的 位 宽 限 制 。 
л В ж 运算 符 通常 情况 下 不 能 被 自动 综合 。 


3.2.2 移 位 运算 符 


移 位 运算 符 包括 4 个 : >> 、<< 、>>> 和 <<<， 前 2 个 为 向 右 和 向 左 的 人 逻 
辑 移 位 运算 符 ， 后 2 个 为 向 右 和 向 左 的 算术 移 位 运算 符 。 

当 使 用 逻辑 移 位 运算 符 ( 即 >> <<) 时 , 0 被 移 人 。 当 使 用 >>> 时 ， 符 
号 位 ( 即 最 高 位 ) 被 移入 ， 当 使 用 <<< 运算 符 时 , 0 RBA, HER: << 与 
<<< 无 区 别 ， 后 者 包括 所 有 位 。 一 些 移 位 操作 的 例子 详 见 表 3-2。 

X32 移 位 操作 的 例子 





a a>>2 a>>>2 a<<2 a«««2 
0100 1111 ' 0001 0011 0001 0011 0011. 1100 0011 1100 
1100 1111 0011 0011 1111 0011 0011 1100 0011 1100 


如 果 移 位 运算 符 的 操作 数 均 为 信号 ， 如 a <<b， 则 该 操作 会 被 推断 为 桶 式 移 
位 器 ,这 是 个 相当 复杂 的 电路 。 另 一 方面 ， 如 果 移 位 数目 是 确定 的 ， 如 a <<2， 
对 该 操作 的 综合 只 会 涉及 对 输入 信和 号 的 布线 ， 而 不 会 推断 出 任何 逻辑 。 

该 类 型 的 操作 也 可 通过 3. 2. 5 节 中 的 catenation 运算 符 描述 。 


3.2.3 关系 和 等 价 运算 符 


关系 运算 符 包 括 > <. SAIS. PRIA FET 2 个 操作 数 进 行 比较 并 返回 
一 个 布尔 型 结果 ， 可 能 是 true (由 1bit 标量 1 表示 ) BY false (由 lbit О Ж 
示 ) 。 

等 价 运算 符 包 括 4 个 : ==、! =、=== 和! ==， 和 关系 运算 符 一 样 ， 等 价 
运算 符 也 返回 true (1bitl) 或 false (1bit0)。=== Ж! == 运算 符 , 分 别称 为 
case 等 式 运算 符 和 case 不 等 式 运算 符 ， 这 两 种 运算 符 会 对 X 和 2 的 值 也 进行 比 
较 ， 两 者 不 能 被 综合 。 

关系 运算 符 == 和 ! = 在 综合 时 会 生成 比较 器 。 


3.2.4 按 位 运算 符 、 缩 减 运算 符 和 逻辑 运算 符 


按 位 运算 符 、 缩 减 运算 符 和 逻辑 运算 符 、 与 、 或 、 蜡 或 及 非 运算 类 似 ， 由 基 
本 的 逻辑 单元 实现 。 

1. 按 位 运算 符 ” 按 位 运算 符 包括 四 种 : & (5), ! (或 )、”( 蜡 或 ) 和 ~ 
GE) 操作 ， 前 3 个 运算 符 需 要 2 个 操作 数 。 非 运算 和 异 或 运算 ,可 以 组 合成 异 
或 非 运 算 。 由 于 这 些 运算 符 是 以 比特 为 运算 单位 ， 因 此 为 按 位 运算 符 。 例 如 ， 假 
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ita, b, c 为 4bit 信号 : 

wire [3:0] а,Ь,с; 

语句 

assign c =a | b ; 

等 同 于 : 

assign c[3] =a[3] | b[3]; 

assign c[2] =a[2] | b[2]; 

assign c[1] =a[1] | b[1]; 

assign c[0] =a[0] | b[0]; 

2. 缩减 运算 符 & (У). | (或 ) 和 ~ (ЧЕ) 操作 可 以 只 有 1 个 操作 数 ， 

此 时 这 三 种 运算 符 被 称 为 缩减 运算 符 。 操 作 数 一 般 为 向 量 ， 指 定 的 操作 会 对 向 量 
中 的 所 有 位 进行 运算 并 返回 一 个 1bit 的 结果 。 例 如 ， 假 设 a 为 4bit fi. y 为 
1bit 信号: 


wire[ 3:0] а; 

wire y; 

语句 

assign y = la;// ЙЕ 
等 同 于 


assign y =a[3]la[2]la[1]la[0]; 

з. ZEZAT ZATE: && GES 5). | 1 (逻辑 或 ) A! 
CEHJ). 3E Ge TERES Gs SERA Ils cC EX RZ, BRATR 
作 数 将 被 识别 为 假 (所 有 位 为 0) 或 真 〈 至 少 一 位 为 1) ， 返 回 结果 也 为 1 位 的 
结果 。 人 逻辑 运算 符 可 被 理解 为 布尔 表达 式 的 逻辑 连接 ， 见 表 3-3, ， 相 应 的 位 运算 
符 也 在 表 中 ， 用 于 说 明 两 种 运算 符 的 差别 。 由 于 Verilog 采用 0 和 1 表达 假 和 真 ， 
位 运算 符 和 逻辑 运算 符 在 某 些 情况 下 可 以 通用 。 然 而 ， 还 是 建议 在 布尔 表达 式 中 
使 用 逻辑 运算 符 ， 在 信号 操作 中 使 用 位 运算 符 。 

表 3-3 人 逻辑 及 位 操作 示例 














a b a&b alb a&&b allb 

0 l 0 1 0 (false) 1 (true) 
000 000 000 000 0 (false) 0 (false) 
000 001 000 001 0 (false) 1 (true) 
011 001 001 011 1 (true) I (true) 


3.2.5 位 拼接 和 复制 运算 符 
位 拼接 运算 符 | 上 ， 用 于 将 两 个 或 多 个 信号 的 某 些 位 拼接 起 来 。 下 面 的 例子 
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说 明了 具体 使 用 方法 : 
- wire al; 
wire [3:0] a4; 
wire [7:0] b8, c8, d8; 


assign b8 = | a4, a4} ; 
assign c8 = {al, al, a4, 2’ b00] ; 
assign d8 = |b8[ 3:0], c8[3:0]}; 
位 拼接 运算 符 的 实现 涉及 输入 信号 和 输出 信号 的 重新 连接 ， 只 需要 “wir- 
ing” 位 拼接 符 的 一 个 应 用 是 对 某 信号 进行 确定 位 数 的 移 位 或 者 循环 移 位 ， 例 如 
wire [7:0] a; 
wire [7:0] rot, shl, sha; 
// 对 a HATA PA BAL 位 
assign rot = {a[2:0], a[8:3]] ; 
// 对 a 进行 右 循 环 移 位 3 位 ,并 插 人 0 ( 810) 
assign shl = |3'b000,a[8:3]]; 
// 对 a HEAT A MEA ELS 位 ,并 插 人 最 席位 (算术 移 位 ) 
assign sha = |a[8], a[8], a[8], a[8:3]] ; 
复制 运算 符 Ni ,用 于 复制 括号 内 的 字符 ,并 进行 拼接 。 常 数 N 表示 复制 的 
КЖ quan, 1412' b01] | 返回 8?b01010101。 
上 面 的 算术 移 位 也 可 简化 为 assign sha = 131a[8]] ,a4[8:3]] ; 


3.2.6 条 件 运 算 符 


条 件 运算 符 ?:, 包含 3 个 操作 数 , 一 般 形 式 为 
[signal] = [ boolean – exp]? [ true-exp | : [ false-exp ] ; 
[ boolean-exp ] 为 布尔 型 表达 式 , 返 回 true ( 1" b1) sk false( 1' БО). `4 [ boolean- 
exp] 的 值 为 真 时 ,[ signal ] 的 值 为 [ true-exp ] ,否则 为 [false-exp ]。 例 如 ,下 面 的 电 
路 获取 了 a All b 中 的 最 大 值 : 
assign max 2 (a >b)? a:b; 
该 运算 符 可 看 作 是 简化 的 if-then-else 语句 : 
if [ boolean-exp | then 
[signal] = [true-exp ] ; 
else 
[signal] = [ false-exp | ; 
抛 开 其 简洁 性 ， 条 件 运算 符 也 可 通过 级 联 或 能 套 的 方式 列举 出 期 望 的 选择 。 
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例如 ， 表 1-1 中 的 等 式 电 路 ， 可 通过 条 件 运算 符 表 达 如 下 : 

assign eq =( ~il & ~i0)? 1 bl: 
( ~il & i0)? 1'bO: 
(il & ~i0)? 1 b0; 
L” bl; 

同样 ， 我 们 可 以 通过 扩展 最 大 值 比较 电路 ， 用 来 返回 a、b fI c 的 最 大 值 : 
assign max=(a>b)? ((a>c)? a:c): 
((b»c)? b:c); 

综合 时 ， 条 件 运 算 符 会 被 推断 为 2 选 1 的 多 路 选择 电路 ， 电 路 详 见 3. 6 Tr. 


3.2.7 运算 符 优先 级 


运算 符 优 先 级 是 指 运算 的 顺序 ， 优 先 级 见 表 34。 计 算 表 达 式 时 ， 最 高 优先 
级 的 运算 符 最 先 被 运算 。 如 ， 表 达 式 a+b>>1，a+b 首先 被 计算 ， 然 后 计算 
>>1。 可 以 通过 插 人 括号 来 改变 计算 顺序 ， ae (b>>1)。 我 们 推荐 使 用 括 
号 ,使 表达 式 更 清晰 ， 如 (a+b) >>1， 虽 然 对 a+b 插入 括号 不 是 必需 的 。 
表 3-4 运算 符 优 先 级 











+ 一 (二 元 ) 





>> << >>> <<< 











3.2.8 表达 式 位 长 度 调 整 


正如 真实 硬件 中 的 信号 一 样 ，Verilog 程序 中 的 线 和 变量 具有 不 同 的 位 宽 
(即位 长 度 或 宽度 ) 。 在 Verilog 语句 中 ， 操 作 数 的 位 宽 是 允许 不 同 的， 但 位 宽 的 
调整 需 遵 循 以 下 规则 ; 

e 在 上 下 文中 确定 操作 数 的 最 大 位 宽 ， 包 括 右 侧 的 表达 式 和 左 侧 的 信号; 

e 扩展 右 侧 操作 数 的 位 宽 至 最 大 值 并 计算 表达 式 的 值 ; 

e 将 结果 赋 给 左 侧 的 信号 ， 如 果 信 号 位 宽 较 小 则 截 去 高 位 。 

首先 看 一 个 简单 的 例子 : 

wire [7:0] a, b; 
assign a = 8' b00000000 ; 
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assign b = 0; 

第 一 个 赋值 语句 将 8 位 信号 “00000000” 赋 值 给 a。 第 二 个 赋值 语句 将 整 型 
数 0 赋值 给 b。 由 于 Verilog 中 的 整 型 数 为 32 位 ,因此 0 被 表示 为 
*00000000000000000000000000000000" , HF b 为 8 位 宽度 ， 因 此 赋值 时 会 将 b 
的 值 截断 为 “00000000”。 虽 然 两 句 都 是 将 全 0 赋值 给 信号 ， 但 我 们 应 注意 最 后 
的 值 是 如 何 得 到 的 。 

再 看 另外 一 个 例子 : 

wire [7:0] a, b; 

wire [7:0] sum8; 

wire [8:0] sum9; 

assign sum8 =a +b; 

assign sum9 =a +b; 

在 第 一 个 赋值 语句 中 ， 所 有 操作 数 均 为 8 位 宽 ， 所 以 会 执行 8 位 的 加 操作 。 

加 法 的 进位 会 被 丢弃 。 第 二 个 赋值 语句 中 ， 由 于 sum 的 位 宽 为 9， 信 号 a 和 
会 被 扩展 到 9 位 ， 然 后 执行 9 位 的 加 操作 。sum9 得 到 的 是 结果 中 的 进位 。 如 果 
要 保留 进位 ， 我 们 还 可 以 使 用 连接 运算 符 进 行 运 算 : 

assign | e out,sum8] =a +b; 

虽然 转换 规则 简单 易 懂 ， 但 一 些 细微 差别 很 有 可 能 导致 错误 。 例 如 ,假设 

a, b, suml, sum2 为 8 位 数据 。 下 面 的 语句 将 得 出 不 同 的 结果 : | 
// ЖО fEfzfijsuml 的 最 高 位 
assign suml = (a+b) >>1; 
// Жа +b Kii fe BY sum2 的 最 高位 
assign sum2 = (0 +a +b) >>1; 

第 一 句 中 ， 所 有 操作 数 为 8 位 ， 所 以 执行 的 是 8 位 的 加 运算 。 当 移 位 操作 执 
行 时 ， 进 位 会 被 丢弃 ，0 会 被 移 到 最 高 位 。 第 二 句 中 ，0 为 整数 ，32 位 宽 ， 所 有 
a 和 b 会 被 扩展 到 32 位 后 进行 加 法 操作 ， 然 后 进行 加 法 和 移 位 。 结 果 会 被 截取 
为 8 位 后 赋值 给 sum2， 因 此 sum2[7] 存 放 的 是 进位 。 这 种 转换 经 常 应 用 在 有 符 
号 数据 类 型 操作 中 ( 详 见 本 书 7.3 节 )。 

可 通过 一 种 安全 但 有 些 繁 琐 的 方式 人 工 调整 操作 数 的 位 宽 。 例 如 ， 获 取 
sum2 的 男 一 种 方式 : 

wire [8:0] sum_ext;// 将 sum 扩展 到 9 位 


assign sum ext = |l' b0,a] + |l' bO,bj ; 
assign sum2 = sum ext[9:1] ; 


代码 较 长 但 不 容易 出 错 。 
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总 之 ， 我 们 必须 注意 Verilog 的 位 长 度 自动 调整 机 制 。 没 意识 到 的 位 宽 不 匹 
配 可 能 会 导致 细微 的 、 不 易 发 现 的 错误 。 除 非 一 些 无 影响 的 调整 ， 如 整数 0 被 置 
为 全 0， 我 们 应 手动 调整 位 长 度 ， 或 者 在 文档 中 完整 注释 所 期 望 的 自动 调整 。 


3.2.9 z. x 的 综合 


除了 常规 的 逻辑 0 ALE 1， 线 网 和 变量 还 可 以 包含 z 和 x 这 两 种 值 。 尽 管 
不 是 运算 符 ， 我 们 仍 安排 在 本 节 讨 论 这 两 种 值 的 综合 。 


z 的 综合 z 表示 高 阻 或 断 开 的 a y 
电路 结构 。z 非 通常 的 逻辑 值 , SON, бо z 
能 被 综合 为 三 态 缓冲 器 。 三 态 缓冲 “ | аһ 


器 的 标识 和 功能 如 图 3-1 所 示 。 绥 
冲 器 的 操作 由 使 能 信号 oe (输出 使 。 。 图 3-1 三 态 缓冲 器 的 标识 及 功能 表 
ВЕ) 控制 ， 该 信号 为 1 时 ， 输 入 端口 传输 到 输出 端口 ， 反 之 ， 该 信号 为 0 时 ， 输 
出 端口 y 可 看 作 是 断 开 电路 。 三 态 缓冲 器 代码 : 
assign y = (oe)? ain:1 bz; 

三 态 缓冲 器 最 常见 的 应 用 是 双向 端口 ， 用 以 实现 对 物理 IO 引 脚 更 为 有 效 的 
利用 。 一 个 简单 的 例子 如 图 3-2 所 示 。 信 号 dir 控制 bi 引 脚 的 信号 流向 。 当 dir 
为 0 时 ， 三 态 缓冲 器 为 高 阻 态 ， 输 出 信号 被 阻 断 。 该 端口 被 用 作 输入 端口 ， 输 入 
信号 连 至 sig_in 信号 。 当 dir 1 时， 引 脚 用 作 输 出 端口 ，sig_out 信号 连 至 外 部 
电路 。HDL 代码 如 下 : 

module bi_demo ( 
inout wire bi, 
) 


assign sig out = output, expression ; 





图 3-2 边界 VO 端口 信号 缓冲 器 


第 3 章 "rdc RA 2 EDS . 49. 





assign some signal = expression with sig in; 


assign bi = (dir)? sig out:1' bz; 


assign sig in = bi; 


注意 ，bi 端口 类 型 一 定 要 声明 为 inout， 用 于 双向 操作 ， 对 于 Xilinx Spartan-3 
器 件 ， 三 态 缓冲 器 只 存在 于 物理 引 脚 的 10B 中 。 因 此 ， 三 态 缓冲 器 只 能 用 于 IO 
端口 的 设计 ， 也 只 能 映射 到 ЕРСА 器 件 的 物理 引 脚 上 。 

x 的 综合 在 一 些 组 合 逻 辑 电 路 中 ， 某 些 输 入 形式 是 不 可 能 发 生 的 ， 所 以 其 输 
出 值 是 无 关 紧 要 的 。 这 时 ， 我 们 会 经 常 将 输出 赋值 为 “忽略 ” 值 。 在 综合 时 ， 
为 了 更 好 地 进行 优化 , “忽略 ” 值 会 被 赋 为 定 值 (0 或 1)。 思 考 表 3-5 所 示 的 真 
值 表 。 假 设 i 不 可 能 为 11， 因 此 其 对 应 的 输出 被 设 定 为 “忽略 ” 值 。 综 合 时 ， 
我 们 可 以 使 用 x 代表 忽略 值 。 上 表 的 一 种 代码 实现 为 





assign y =(i==2’b00)? 1’b0; R35 B fh X 
(iz22'b01)? 1 bl: 输入 i 输出 y 

(i==2"b10)%? 1’bl: 0 0 0 

V pazzi ЫИ 01 1 

虽然 该 方法 可 以 帮助 简化 电路 结构 ， 但 是 会 引 1 0 1 

和 人 仿真 和 综合 的 不 一 致 。 仿 真 中 , x 是 0 和 1 之 外 kä x 


的 独立 值 。 如 果 仿 真 时 输入 为 11 ， 输 出 会 变 为 x， 
这 与 综合 后 的 结果 (0 或 1) 是 不 一 致 的 。 然 而 ， 由 于 原始 规范 要 求 任何 情况 下 
不 应 出 现 11 ， 因 此 testbench 中 出 现 的 x 可 作为 潜在 错误 的 提示 。 


3.3 组 合 逻 辑 电 路 always Ж 


为 便于 系统 建 模 ，Verilog 包含 大 量 顺序 执行 的 过 程 语句 。 由 于 这 些 语句 的 
行为 不 同 于 通常 的 并 行 电路 模型 ， 因 此 要 封装 在 always ak initial 块 中 使 用 。in- 
itial 块 只 在 仿真 开始 时 执行 一 次 。initial 可 在 仿真 过 程 中 使 用 ， 如 示例 1.7 中 所 
示 。 只 有 always 块 可 以 被 综合 ， 本 闻 会 进行 详细 的 讨论 。 由 于 顺序 语句 更 抽象 ， 
因此 这 种 类 型 的 代码 常 被 称 作 行 为 描述 。 

always 抉 可 以 被 当做 黑 盒 子 ， 其 行为 由 内 部 的 顺序 语句 描述 。 顺 序 语句 包含 
很 多 结构 ， 但 许多 是 没有 明确 的 硬件 相对 应 的 。 不 好 的 always 块 经 常会 导致 不 
必要 的 复杂 实现 ,或 者 根本 不 能 被 综合 。 本 市 将 重点 讨论 组 合 逻 辑 电 路 的 综合 ， 
我 们 仅 限于 以 下 3 种 语句 的 讨论 : 

e 阻塞 顺序 赋值 ; 
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e if im]; 
€ case 语句 。 


后 两 种 可 以 认为 是 推断 布线 结构 的 构建 语句 。 
3.3.1 基本 语法 和 行为 


带 有 敏感 列表 (又 称 事件 控制 表达 式 ) 的 always 块 简化 语法 : 
always @ ( [ sensitivity-list | ) 
begin [ optional name ] 
[ optional local variable declaration | ; 
[ procedural statement ] ; 


[ procedural statement | ; 


end 
[ sensitivity-list | 是 信号 和 事件 的 列表 ，always 块 需 要 对 这 些 信 号 和 事件 做 出 
响应 。 对 于 组 合 逻 辑 电路 , 所 有 的 输入 信号 都 应 该 包含 在 敏感 列表 中 。always B 
可 包含 任意 数量 的 顺序 语句 。 如 果 只 有 一 条 语句 , MU begin 和 end 可 以 省 略 。@ 
( [ sensitivity-list ] ) 语 句 实际 上 是 一 种 时 序 控制 结构 。 在 可 综合 的 always 块 中 ， 它 
通常 是 唯一 的 时 序 控制 结构 。 
always 块 可 看 作 是 一 种 复杂 的 电路 组 成 部 分 ， 可 被 挂 起 或 激活 。 当 敏感 列表 
中 的 任 一 信号 发 生变 化 或 事件 发 生 时 ， 该 部 分 电路 会 被 激活 并 执行 内 部 的 顺序 语 
句 。 由 于 没有 其 他 的 时 序 控制 结构 ， 执 行 过 程 会 一 直 进 行 ， 直 到 最 后 一 条 语句 完 
成 ， 电 路 挂 起 。 因 此 ，always 块 实际 上 是 个 “无 限 循环 "， 每 个 循环 的 开始 由 敏 
感 列表 控制 。 


3.3.2 顺序 赋值 语句 


顺序 赋值 只 能 在 always 或 initial 块 中 使 用 ， 赋 值 语句 有 两 种 : 阻塞 赋值 和 非 
阻塞 赋值 。 基 本 语法 如 下 : 

[ variable-name | = [ expression | ;// SH 3E UB 

[ variable-name | <= [ expression | ;// JEM Æ iC (E 

阻塞 赋值 ， 表 达 式 的 值 经 过 计算 后 会 在 执行 下 条 语句 前 立即 赋值 给 变量 
(赋值 过 程 “ 阻 塞 ” 了 其 他 语句 的 执行 ) 。 其 表现 类 似 C 语言 中 普通 变量 赋值 。 
在 非 阻 塞 赋值 中 ， 表 达 式 的 值 会 在 always 块 的 最 后 进行 赋值 (赋值 行为 不 会 阻 
塞 其 他 语句 的 执行 ) 。 

阻塞 和 非 阻 塞 赋值 经 常 令 Verilog 新 手 困惑 ， 如 果 不 理解 这 两 种 同 赋值 的 区 别 ， 
可 能 会 导致 无 法 预料 的 电路 行为 或 者 产生 竞争 冒险 。 使 用 的 基本 使 用 原则 是 : 
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ө 对 组 合 逻辑 使 用 阻塞 赋值 ; 

e 对 时 序 逻 辑 使 用 非 阻 塞 赋值 。 

| 我 们 会 在 本 书 7. 1 节 中 详细 讨论 阻塞 赋值 和 非 阻塞 赋值 。 由 于 本 章 的 核心 是 
组 合 逻辑 电路 ， 所 以 只 会 用 到 阻塞 赋值 语句 。 


3.3.3 变量 数据 类 型 


过 程 赋值 的 表达 式 只 能 赋值 给 变量 ， 类 型 可 以 是 тер, integer, real, time 和 
realtime, reg 数据 类 型 和 wire 数据 类 型 相似 , 但 只 能 与 过 程 赋 值 一 起 使 用 。I 
net tre et 


由 于 位 宽 固定 ,通常 不 用 其 进行 综合 。 其 他 的 数据 类 型 用 于 建 模 和 仿真 ， 不 能 被 
综 


综合 。 


3.3.4 简单 示例 


我 们 用 两 个 简单 示例 说 明 always 块 和 阻塞 赋值 的 用 法 。 
1 位 比较 器 ”我们 可 以 将 示例 1.1 中 的 1 位 比较 器 电路 重新 用 always 块 实 
现 ， 如 示例 3. 1 所 示 。 
示例 3.1 1 位 比较 器 的 always 块 实现 


module eql_always 
( 
input wire i0, il, 
output reg eq //eq 声明 为 reg 数据 类 型 
); 
// p 和 pl 声明 为 reg 数据 类型 
rp, pl; 
always @ (10, il) //i0 #111 p ESE 
begin 
// 语句 顺序 很 重要 
die Же; 
pl 2i & if; 
eq = p0!pl; 
end 


endmodule 
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由 于 eq, pO 和 pl 信号 在 always 块 中 赋值 ， 它 们 被 声明 为 reg 数据 类 型 。 敏 
感 列 表 中 包括 O 和 让， 逗号 分 隔 。 当 其 中 之 一 变化 时 ，always 块 被 激活 。3 SBA 
塞 赋值 语句 会 顺序 执行 ， 类似 C 程序 语句 。 语 句 顺序 很 重要 ， 且 pO 和 pl 在 使 用 
前 应 被 赋值 。 

在 Verilog-1995 中 ， 敏 感 列表 中 的 逗号 由 关键 字 or 替代 。 例 如 

always @ (a, b, c) 

被 写作 

always @ (a or b or c) 

本 书 中 我 们 通常 使 用 逗号 。 

组 合 逻 辑 电 路 必须 将 有 输入 信号 包含 在 敏感 列表 内 ， 以 实现 对 期 望 的 行为 进 
行 正 确 建 模 。 缺 失 一 个 信号 可 能 会 导致 综合 和 仿真 的 不 一 致 。 在 Verilog - 2001 
中 ， 我 们 可 以 使 用 符号 : 

always @ x 
隐 含 包含 所 有 的 输入 信和 号。 本 书 中 ， 我 们 会 在 组 合 罗 辑 电 路 中 使 用 这 种 结构 。 

三 输入 与 门 示例 1.1 和 示例 З. 1 的 相似 会 令 人 费解 ， 连 续 赋值 与 过 程 语句 是 
完全 不 同 的 。 思 考 示 例 3.2 中 的 代码 ， 这 是 一 段 实现 对 a、b File 相 与 操作 (Ша 
&b&c) 的 电路 。 

示例 3.2 行为 精 减 且 使 用 一 个 变量 的 与 操作 电路 





module and block assign 
( 
input wire a, b, c, 
output reg y 
)3 
always @ * 
begin 
y =a; 
y=y & b; 
y=y & c; 
end 


endmodule 


综合 后 电路 如 图 3-3a 所 示 ， 如 果 我 们 用 类 似 的 方式 连续 赋值 ， 如 示例 3.3 
所 示 ， 描 述 是 错误 的 。 
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а 
а b y 
Ў с 


а) b) с) 


图 3-3 正确 及 错误 的 语句 综合 后 电路 








示例 3.3 精简 的 与 门 电路 错误 代码 


module and_cont_assign 
( 
input wire a, b, c, 
output wire y 
)s 
assign y =a; 
assign y =y & b; 
assign y =y & c; 


endmodule 


在 以 上 代码 中 ， 每 个 连续 赋值 会 综合 成 一 个 电路 部 分 ，y 在 左边 出 现 三 次 意 
味 着 三 路 输出 被 绑 在 一 起 。 对 应 的 电路 如 图 3-3e 所 示 ， 显 然 这 不 是 我 们 想 要 的 
电路 结构 。 


3.4 让 语句 


3.4.1 语法 


计 语 句 的 简化 语法 为 
if [ bool-expr ] 
begin 

[ procedural statement ] ; 

[ procedural statement | ; 
end 


else 
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begin 
[ procedural statement ] ; 
[ procedural statement ] ; 
end 
【boolean-expr】 是 布尔 型 表达 式 ， 会 被 最 先 计算 。 如 果 结 果 为 真 ， 会 执行 接 
PORN, AM, else 分 支 中 的 语句 将 被 执行 。else 分 支 是 可 选 的 ， 可 以 省 
略 。 如 果 分 支 中 只 有 一 条 procedural if), begin 和 end 也 可 以 省 略 。 
可 将 多 个 让 语句 进行 “级 联 *， 以 实现 多 种 条 件 及 优先 级 的 计算 ,如 
If [ Boolean expr 1] 


else if [ Boolean expr 2 | 
else if [ Boolean. expr 3] 
else 


综合 时 ,站 语句 会 推断 出 “优先 级 布线 ”网 络 ， 相 关 话题 会 在 本 书 3.6 节 详 
细 讨 论 。 


3.4.2. 示例 表 3-6 四 请 求 优先 编码 器 功能 表 





输入 输出 

我 们 用 两 个 简单 的 示例 来 说 明 这 语 r peode 
句 的 用 法 。 第 一 个 例子 是 优先 级 编码 器 。 ! 一 一 — 1 0 0 
优先 级 编码 器 有 4 个 请 求 : [4]. 3]. ° 1 7 7 9 1 0! 
[2] 和 r[1], 分 组 为 一 个 4 位 的 输入 信和 号 | | _ N | А А 
г, r[4] 拥 有 最 高 优先 级 。 其 功能 表 见 表 。 。 ， о о о о 


3-6, HDL 代码 如 示例 3.4 所 示 。 
示例 3.4 使 用 主语 句 的 优先 编码 恬 


module prio_encoder_if 
( 
input wire [4:1] r, 
output reg [2:0] y 
)i 
always @ * 


if (r[4] 221' bl) // 也 可 写 为 r[4 ] 
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у=3*Ы00; 

else if (r[3] ==1'b1) // 也 可 写 为 r13 ] 
у=3'Ь011; 

else if (r[2] ==1’ bl) // thay т [2 ] 
y =37b010; 

else if (r[ 1] ==1’ bl) // 也 可 写 为 r[1 ] 
y=3'b001; 

else 
y =3'b000; 


endmodule 


代码 会 首先 检查 r[4] 的 请 求 ， 若 请 求 有 R37 带 使 能 的 2:4 解码 器 真 值 表 
效 则 赋值 100 给 和 输出。 如 果 r[4] 的 请 求 无 输入 输出 
效 ， 就 会 接着 检查 r[3 ] 的 请 求 ， 直 到 所 有 请 ”性 能 a(1) a(0) y 
求 被 检查 。 注 意 ， 当 r[4] 为 1 时 , 布尔 表达 о 一 一 
式 (r[4] ==1’bl) 为 真 。 由 于 在 Veriolg 中 真 | 
值 也 会 被 表示 为 1' bl， 因此 布尔 表达 式 也 可 1 
写作 (rt[4])。 1 

第 二 个 例子 是 个 二 进 制 解码 器 。 一 个 n | 
:2" 解码 器 根据 输入 组 合 置 2" 位 中 的 1 位 有 
效 。 表 3-7 给 出 了 2:4 解码 器 的 真 值 表 ， 电 路 还 会 带 有 一 个 控制 信号 en ， 有 效 时 
使 能 该 解码 功能 。HDL 代码 详 见 示例 3. 5。 

示例 3.5 使 用 让 语句 表示 的 二 进 制 解码 器 


0 
0 
1 
1 


= © ° ° o 


0 
0 
0 
1 
0 


o © = o o 


0 
0 1 
1 0 
0 0 
1 0 


module decoder 2 4 if 
( 
input wire [1:0] a, 
input wire en, 
output reg [3:0] y 
)5 


always @ * 
if (en 221" b0) // t n] 5 Jj ( ~ en) 
y -4' b0000; 


else if (a==2’ b00) 
y -4' b0001 ; 


. 56 · 用 Verilog 设计 FPGA 样机 实例 解析 (Xilinx Spartan-3 版 ) 





else if (a 222' b01) 
y -4' b0010; 
else if (a ==2’ b10) 
y -4' b0100; 
else 
y -4' b1000; 


endmodule 


代码 首先 确认 en 是 否 有 效 ， 如 果 条 件 为 假 〈 即 en 为 1) ， 程 序 会 顺序 测试 4 
个 二 进 制 组 合 。 注 意 布尔 表达 式 (en==1’ b0) 也 可 写作 ( ~en) 。 


3.5 case 语句 


3.5.1 语法 
case 语句 的 简化 语法 如 下 : 


case [ case-expr ] 
[item]: 
begin 
[ procedural statement ] ; 


[ procedural statement ] Š 


end 
[item]: 
begin 
[ procedural statement ] ; 


[ procedural statement ] ; 


end 
[item]: 
begin 
[ procedural statement ] ; 


[ procedural statement ] ; 


end 
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default: 
begin 
[ procedural statement | ; 


[ procedural statement | ; 


end 
endcase 
case 语句 是 一 种 多 路 选择 语句 ， 这 种 语句 会 将 一 系列 [item ] 表 达 式 与 [ case_ 
expr] 表 达 式 进行 比较 。 当 某 条 分 支 的 [item] 值 与 [ case_expr] 匹 配 时 ,该 分 支 的 
语句 将 被 执行 。 如 果 有 多 条 分 支 匹配 时 , 将 会 执行 第 一 条 被 匹配 的 分 支 语 句 。 最 
后 的 item 可 以 是 可 选 的 default 关键 字 , 它 将 覆盖 所 有 [| case_exprj] 表 达 式 未 指定 
的 值 。 如 果 分 支 中 只 有 一 条 顺序 语句 时 , 则 begin 和 and 分 隔 符 可 以 省 略 。 


3.5.2 示例 


我 们 用 相同 的 编码 和 解码 器 例子 说 明 case 语句 的 用 法 。 表 3-7 为 2:4 解码 器 
的 真 值 表 。 示 例 3.6 给 出 了 用 case 语句 实现 的 HDL 代码 。 
示例 3.6 使 用 case 语句 的 二 进 制 解码 器 


module decoder 2 4 case 
( 
input wire [1:0] a, 
input wire en, 
output reg [3:0] y 
ү 
always @ +* 
case( | en,al] ) 
3’ b000, 3' b001, 3' b010, 3' bO11; y =4’ b0000; 
3’ b100; y =4’ b0001 ; 
3' bl01: y =4’ b0010; 
3’b110; y =4’ b0100; 
3' blll: y 24' b1000; // th n] fii Hj default 4) xc 
endcase 


endmodule 
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如 果 所 有 值 使 用 同样 的 表达 式 ， 我 们 可 以 将 多 个 数据 拼 成 一 个 表达 式 ， 如 第 
10 行 。 注 意 ，{en ,al 表达 式 的 所 有 可 能 值 都 被 覆盖 。 
优先 级 编码 器 的 功能 表 详 见 表 36。HDL 代码 如 示例 3. 7 所 示 。 
示例 3.7 使 用 case 语句 的 优先 编码 器 


module prio_encoder_case 
( 
input wire [4:1] r, 
output reg [2:0] y 
ys 
always @ * 
case(r) 
4 b1000, 4’ b1001, 4’ b1010, 4’ b1011, 
4’b1100, 4’ b1101, 4’ b1110, 4’ bl111: 
y =3’b100; 
4' b0100, 4' b0101, 4’ b0110, 4’ bO111; 
y=3'b011; 
4'b0010, 4’ b0011; 
y =3’ b010; 
4’ b0001 : 
y -3' b001; 
4'b0000; // 也 可 使 用 default 4) xc 
y =3'b000; 
endcase 


endmodule 


3.5.3 casez 和 casex 语句 


除了 常规 的 case 语句 外 ， 还 有 其 他 两 种 case 表达 式 。 在 casez 语句 中 ,，z fH 
和 分 支 表 达 式 中 的 ? 会 被 忽略 ( 即 ， 对 应 位 无 需 匹 配 ) TE casex 语句 中 ，z、x 
及 分 支 表 达 式 中 ? 会 被 忽略 。 因 为 z 和 x 在 仿真 中 可 能 出 现 ,? 符号 会 经 常 被 使 
用 。 例如, 上面 的 优先 编码 器 代码 可 以 使 用 casez 语句 编写 ， 如 示例 3. 8 所 示 。 
示例 3.8 使 用 casez 语句 的 优先 编码 器 


module 
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( 

input wire [4; 1] r, 
output reg [2: 0] y 

38 

always @ ж 

casez (г) 

4° bl?7?: y=3” b100; 
4° b01??; у=3° Ь011; 
4’ 0017: y -3' b010; 
4' 0001: y=3' b00l; 
4' b0000: y 3' b000; // 也 可 使 用 default 分 支 
endcase 


endmodule 


3.5.4 full case 5 parallel case 


在 Verilog 中 ，[item] 表 达 式 不 需要 包括 [ case-expr] 表 达 式 的 所 有 值 ， FF ELE 
些 值 还 可 能 会 被 匹配 多 次 。 如 下 面 的 casez 语句 : 
reg[2:0] s 


casez (s) 
3'blll; y=1’bl; 
3°Ь1??: y z1'b0; 
3'b000: y z1' bl; 
endcase 
在 上 面 的 语句 中 , 3'b111 会 被 匹配 两 次 (一 次 在 3’ bl11 中 , 一 次 在 3 177 
中 ) 。 由 于 第 一 次 匹配 有 效 ,如 果 s 为 3"bll1, y 结 果 为 1, 24 sX 3' bO01, 3’ b010 
或 者 3’b011 AY, 无 匹配 项 , y 将 会 “保持 原 值 ”。 
当 [ case-expr] 表 达 式 的 所 有 可 能 值 都 被 [item] 分 支 表 达 式 覆盖 ， 这 种 case 语 
句 称 之 为 fnll case; 对 组 合 逻 辑 电路 来 说 ， 每 一 种 输入 组 合 都 应 有 一 个 输出 值 相 
对 应 ， 因 此 必须 使 用 full case。 可 以 通过 增加 default 分 支 覆 盖 所 有 的 未 匹配 值 。 
例如 ， 以 上 语句 可 以 修改 为 
casez (s) 
ЗЫ у=1"Ы; 
3'b1??: y=1’b0; 
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default; y 2 1' bl; // 对于 未 将 证 分 支 表达 式 值 y 为 1 
endcase 
case z (s) 
ЗЫП: y=l"hl; 
3'b17?: y 217 b0; 
3'b000; y =1 bl; 
default; y=1’ bx; //y AH BUA 
endcase 
当 分 支 表 达 式 中 的 值 都 互 斥 〈 即 某 值 只 能 出 现在 一 个 分 文中 ) 时 ， 称 之 为 
parallel case。 例 如 ， 上 面 的 case 语句 不 是 parallel case, Ay 3’ b111 出 现在 两 个 
分 支 中 。 示 例 3.6 和 示例 3.7 中 的 case 语句 为 parallel case, 
综合 时 ，parallel case 语句 通常 推断 为 多 路 开关 布线 网 络 ， 非 parallel case TË 
句 通常 推断 为 优先 级 布线 网 络 。 下 节 我 们 会 详细 介绍 。 
许多 综合 工具 都 有 “fall case 指令 ”和 “parallel case 指令 ”， 使 用 这 些 指 令 
时 ， 所 有 的 case 语句 会 被 当做 full case 或 parallel case 进行 综合 。Verilog-2001 也 
具有 相似 的 特性 来 实现 该 目的 。 使 用 这 类 指令 会 改变 Verilog 代码 本 来 的 语义 ， 
导致 仿真 和 综合 的 不 一 致 。 本 书 中 ， 我 们 使 用 代码 实现 “ful case” Ail “parallel 
case”， 而 非 通过 指令 或 属性 来 实现 。 


3.6 条件 控制 语句 的 布线 结构 


我 们 介绍 了 几 种 条 件 控制 语句 ， 包 括 ?: 运算 符 、 计 和 case 语句 。 在 C 语言 
中 ,这些 结构 都 是 顺序 执行 。 在 组 合 逻 辑 电 路 中 是 没有 这 种 “顺序 ”控制 的 。 
这 些 结构 通过 路 由 网 络 实现 。 所 有 表达 式 同 时 计算 ， 路 由 网 络 把 结果 路 由 到 输出 
端 。 布 线 结构 包括 两 种 : 优先 路 由 网 络 和 多 路 选择 网 络 。 这 两 种 结构 通常 分 别 由 
if-else 语句 和 parallel case 语句 生成 。 


3.6.1 优先 路 由 网 络 


优先 路 由 网 络 由 一 连 串 的 2 选 1 多 路 选择 器 实现 。2 选 1 多 路 选择 器 的 真 值 
表 和 电路 图 如 图 34a 所 示 。if-else 语句 会 被 推断 为 优先 路 由 网 络 。 如 下 面 的 语 
fj: 
if (m ==n) 

r=a+b+c; 

else if (m >n) 


r=a-b; 
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else 

г=с+1; 

电路 框图 如 图 34b 所 示 。 两 个 2: 1 多 路 选择 器 形成 了 优先 路 由 网 络 ， 其 他 
部 分 实现 了 各 种 布尔 及 算术 表达 式 。 如 果 第 一 个 布尔 条 件 表达 式 (BI m ==n) 
为 真 ,+ 输出 为 a+b+c， 否 则 ,端口 0 的 数据 会 输出 到 го 第 二 个 布尔 条 件 表达 
A ( 即 m >n) 决定 了 a-b 还 是 c+1 路 由 到 输出 。 


il sel y 

Е y ; 

10 O(false) i0 
l(tue) il 


a) 2:1 多 路 选择 器 示意 图 
数值 表达 式 电路 





b) 让 语句 示意 图 


图 34 站 语句 的 实现 


注意 ， 所 有 的 布尔 表达 式 和 算术 表达 式 的 计算 是 并 行 的 ， 布 尔 表 达 式 的 输出 
作为 多 路 选择 器 的 选择 信号 ， 用 于 将 期 望 结 果 路 由 至 ro 级 联 级 数 与 if-else 语句 的 
个 数 成 正比 。 大 量 使 用 让 else 语句 会 导致 很 长 的 级 联 链 路 并 导致 较 大 的 传播 延 时 。 
条 件 运算 符 〈?:) 类 似 一 种 简化 的 让 else 语句 并 能 够 生成 相似 的 优先 路 由 
网 络 。 非 parallel case 语句 会 对 第 一 个 匹配 分 支 设置 一 个 优先 权 ， 因 此 也 会 生成 
相似 的 优先 路 由 网 络 。 例 如 下 面 的 case 语句 : 
case( expr ) 


iteml : statementl ; 
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item2 : statement2 ; 
item3 ; statement3 ; 


default: statement4 ; 


endcase 
它 可 以 被 转化 为 

if[ expr == iteml ) 
statement] ; 
elseif[ expr == item2 ) 
statement2 ; 


elseif[ expr == item3 | 
statement3 ; 
else 


statement4 ; 


3.6.2 多 路 选择 网 络 


多 路 选择 网 络 是 通过 nn 选 1 多 路 选择 器 实现 的 。 期 望 的 输入 端口 被 选择 信号 
选 定 ， 这 样 相应 的 输入 端 便 被 路 由 到 输出 端 。2 HE 1 多 路 选择 器 示意 图 和 真 值 
表 如 图 3-5a 所 示 。 

在 parallel case 语句 中 ， 我 们 可 以 把 case 表达 式 的 每 个 值 都 映射 为 多 路 选择 
器 的 一 个 输入 端口 ， 并 将 相应 结果 连接 到 端口 上 。case 表达 式 被 选择 信号 连接 。 
可 以 通过 一 个 例子 解释 。 如 下 面 case 语句 : 
wire [1:0] sel; 


case(sel) 

2'b00: r=a+b+c; 

2'bl0: r=a-b; 

default: r2 c +1; //2’b01, 2’ bil 
endcase 

该 语句 示意 图 如 图 3-5b 所 示 。 假 设 sel 变量 有 4 种 可 能 的 值 : 00、01、10 和 
11。 意 味 着 一 个 sel 作为 选择 信号 的 2 He 1 多 路 选择 器 。 当 sel 为 00 时 ，a+b+ 
c 所 得 的 结果 被 路 由 到 r 端 ， 当 sel 为 10 BF, a-b 所 得 的 结果 被 路 由 到 上端 ， 当 
sel 为 10 或 者 11 BF, c +1 所 得 的 结果 被 路 由 到 工 端 。 

再 次 注意 ， 所 有 数值 表达 式 的 计算 都 是 并 行 的 。Sel 变量 被 用 作 选 择 信号 将 
期 望 结 果 路 由 至 输出 端 。 多 路 选择 器 宽度 〈 即 输入 端口 数量 ) 随 着 sel 信号 呈 几 
何 增长 。 
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总 的 来 说 , 当 优先 权 在 特定 的 条 件 下 给 定时 , 带 有 优先 级 的 路 由 网 络 更 为 有 效 ， 
如 优先 编码 器 , 对 于 真 值 表 或 功能 表 , 多 路 选择 网 络 更 为 有 效 ,如 二 进 制 解 码 器 。 








a) 4 选 1 多 路 选择 器 示意 图 和 功能 表 
数值 表达 式 电路 


FR x5.) tg ee CC 多 路 选择 器 





b) parallel case 语 名 示意 图 


图 3-5 parallel case 语句 实现 


3.7 always 块 的 通用 编码 准则 


Verilog 可 用 于 建 模 和 综合 。 在 编写 用 于 综合 的 代码 时 ， 我 们 要 注意 不 同 的 
语言 结构 是 如 何 映射 到 硬件 的 ， 这 一 点 对 于 always 块 尤为 重要 ， 因 为 变量 和 顺 
序 语句 可 以 在 块 内 使 用 。 我 们 要 牢记 : 代码 的 目标 是 生成 硬件 电路 ， 而 不 是 用 C 
描述 一 个 顺序 算法 。 不 这 样 做 会 经 常 导 致 一 些 不 可 综合 的 代码 、 不 必要 的 复杂 实 
现 或 仿真 和 综合 之 间 的 差异 。 在 本 节 中 ， 我 们 回顾 一 些 常见 的 错误 ， 并 推荐 一 些 
编码 准则 。 


3.7.1 组 合 逻 辑 电 路 代码 的 常见 错误 


以 下 是 在 组 合 逻辑 电路 代码 中 常见 的 错误 : 
e 同一 变量 被 多 个 always 块 赋值 ; 

© 敏感 列表 不 完整 ; 

° 不 完全 的 分 支 和 不 完整 的 输出 赋值 。 
这 些 错误 会 在 后 续 内 容 中 讨论 。 
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同一 变量 被 多 个 always 块 赋值 在 Verilog 中 ， 变 量 是 允许 被 多 个 always 块 赋 
ЇН ( 即 出 现在 表达 式 左 侧 ) 的 。 例 如 ， 下 面 的 代码 片段 中 ，y 变量 在 两 个 always 
块 中 被 赋值 : 

reg y; 

reg a,b,clear; 


always @ * 
if( clear) y 2 1' b0; 
always @ * 
y =a&b; 
尽管 代码 语法 正确 ， 能 被 仿真 ， 但 却 不 能 被 综合 。 回 想 一 下 ， 每 个 always 
块 均 可 被 翻译 为 一 个 电路 部 件 。 上 面 的 代码 表明 ，y 是 两 个 电路 部 件 的 输出 ， 且 
能 被 每 个 部 件 更 新 。 没 有 任何 物理 电路 能 够 表现 这 种 行为 ， 因 此 代码 是 不 可 综合 
的 。 我 们 必须 把 赋值 语句 分 组 到 一 个 单独 的 always 块 中 ， 如 
always @ x 
if( clear) 
y =1’b0; 
else 
y =a&b; 
敏感 列表 不 完整 对 于 一 个 组 合 逻辑 电路 而 言 ， 输 出 是 输入 的 函数 ， 因 此 输 
入 信号 的 任何 变化 都 应 激活 电路 。 这 意味 着 ， 所 有 的 输入 信号 都 应 包括 在 敏感 列 
表 中 。 例如， 一 个 两 输入 的 与 门 可 写 为 
always € (a, b) //a 和 b 者 在 敏感 列表 中 
y =a&b; 
如 果 我 们 忘记 包括 b, 代码 会 变 成 
always @ (a) //b 从 敏感 列表 中 丢失 
y =a&b; 
虽然 代码 在 语法 上 仍然 正确 ,但 是 其 行为 却 完全 不 同 。 当 a 发 生变 化 ，al- 
ways 块 被 激活 ，y 得 到 a&b 的 值 。 当 b 改变 ，always 块 依然 被 挂 起 ， 因 为 它 对 上 
是 不 “敏感 ”的 ，y 保持 之 前 的 值 。 没 有 物理 电路 能 体现 这 种 行为 。 作 为 替代 ， 
大 多 数 综合 软件 将 发 出 警告 信息 ， 并 推断 出 与 门 。 然 而 仿真 软件 仍 会 模拟 预期 的 
行为 ， 因 此 导致 了 仿真 和 综合 之 间 的 差异 。 
Verilog-2001 引入 了 一 个 特殊 的 符号 ，@ * ， 用 于 隐 式 包括 所 有 相关 的 输入 信 
号 ， 从 而 消除 了 这 个 问题 。 对 组 合 逻 辑 电路 描述 使 用 这 个 符号 是 一 个 很 好 的 做 法 。 
不 完全 分 支 和 不 完整 的 输出 赋值 组 合 逻辑 电路 的 输出 是 个 只 与 电路 输入 有 关 
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的 函数 ， 不 应 该 包含 任何 内 部 状态 〈 即 存储 器 ) always 块 中 一 个 常见 的 错误 就 
是 在 组 合 逻 辑 电路 中 生成 存储 器 。Verilog 标准 规定 ， 在 always 块 中 如 果 变 量 没有 
被 赋值 ， 它 将 保持 原 值 。 在 综合 过 程 中 ， 将 会 形成 内 部 状态 〈 一 个 闭合 反馈 环 ) 
或 存储 元 件 〈 如 一 个 锁 存 器 ) 。 
为 了 防止 always 块 中 无 意 的 存储 器 的 产生 ， 所 有 的 输出 信号 在 任何 时 间 都 要 
被 赋予 一 个 合理 值 。 不 完全 分 支 和 不 完整 的 输出 赋值 是 导致 产生 存储 器 的 两 个 常见 
错误 ,为 了 避免 这 些 ， 我 们 在 开发 组 合 逻 辑 电 路 的 代码 时 应 该 遵守 以 下 规则 : 
€ 让 或 case 语句 应 该 包含 所 有 的 分 支 ; 
© 在 每 一 个 分 支 为 每 一 个 输出 信和 号 赋值 。 
思考 下 面 的 这 段 代 码 ， 它 描述 的 是 一 个 产生 大 于 有 效 (BD GT) 输出 信号 和 
等 于 有 效 ( 即 EQ) 输出 信号 的 电路 。 
always @ + 
if( a » b)// 在 这 个 分 支 中 eq ABE 
gst=1’bl; 
else if(a==b) // 在 这 个 分 支 中 gt 未 被 赋值 
eq=1’bl; 
// 最 后 else 2H ж BERN 
该 段 代 码 违 反 了 这 两 条 规则 。 
让 我 们 先 查看 不 完全 分 支 的 错误 。 代 码 片段 中 没有 else 分 支 。 如 果 两 个 a > 
b 和 a==b 的 表达 式 都 是 假 的 ，gt 和 eq 都 没有 被 赋值 。 根 据 Verilog 的 定义 ， 它 
们 将 保持 以 前 的 值 ( 即 输出 取决 于 内 部 状态 ) 并 生成 锁 存 器 。 
代码 片段 还 有 不 完整 输出 赋值 的 错误 。 例 如 ， 当 a b 的 表达 式 是 真实 的 ， 
eq 没有 被 赋值 ， 这 样 便 会 保持 以 前 的 状态 ， 从 而 生成 锁 存 器 。 
有 两 种 方法 可 以 修改 此 错误 。 第 一 种 是 添加 else 分支， 并 为 所 有 的 输出 变量 
显 式 赋值 。 代 码 变 为 
always @ * 
if (a >b) 
begin 
gt=1'bl; 
eq 21' b0; 
end 
else if (a==b) 
begin 
gt- 1’ b0; 
eq z1'bl; 
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end 
else// Bla < b 
begin 
gt - 1' b0; 
eq =1’b0; 
end 


另 一 种 方法 是 在 always 块 的 开始 为 每 一 个 变量 指定 一 个 默认 值 ， 用 来 覆盖 
未 指定 的 分 文 和 未 赋值 的 变量 。 代 码 会 变 成 : 
always @ * 
begin 
gt z1' b0; //gt BOAT 
eq 21' b0;//eq RUA 
if (a>b) 
gt- 1’ bl 2 
else if (a ==b) 
eq =1’bl; 
end 
如 果 gt Al eq 在 后 面 没有 被 赋值 ， 那 么 它们 都 会 被 赋值 为 0。 
如 果菜 些 [ case-expr ] 所 表示 的 值 没 有 被 分 支 表 达 式 覆盖 到 ，case 语句 会 遇 到 
相同 的 错误 (也 就 是 说 ,不 是 一 个 完整 的 сазе 语句 ) 。 思 考 下 面 的 代码 片段 : 
reg [1:0] s 


case (s) 
2'b00: y=1'bl; 
2'bl0: y z1' b0; 
2'bll: y=1’ bl; 
endcase 
(E 2’ b01 不 包括 在 任何 一 个 分 支 中 。 如 果 s 出 现 这 个 组 合 ，y 将 保持 其 先前 
的 值 ， 并 产生 一 个 意料 之 外 的 锁 存 器 。 要 修正 这 个 错误 必须 确保 y 在 任何 时 刻 都 
被 赋值 。 方 法 之 一 是 在 末尾 使 用 default 的 关键 字 来 覆盖 所 有 未 指定 的 值 。 我 们 
还 可 以 替换 最 后 一 个 分 支 表 达 式 ; 
case (s) 
2'b00: y=1’ bl; 
2'bl0: y =1’b0; 
default; y=1’ bl; // 在 2 'b01 状态 时 y 的 值 为 1 
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endcase 
或 将 一 个 忽略 值 添 加 到 新 的 分 支 中 : 
case (s) 
2’b00: y=1'bl; 
2’b10; y=1'b0; 
2'bll; y=1’bl; 
default; y 21'bx; // 在 2 'b01 状态 时 7 的 值 为 不 定 态 x 
endcase 
或 者 在 always 块 的 最 开始 指定 一 个 默认 值 : 
y=1 7 0; // 也 可 使 用 y =1 'bx FP" ЩН 
case (s) 
2'b00; y=1'bl; 
2'bl0; y=1'b0; 
2'bll;: y=1’bl; 


endcase 


3.7.2 准则 


always 块 是 一 个 灵活 而 强大 的 语言 结构 。 但 是 ,人 须 谨 慎 使 用 ， 在 生成 正确 有 效 


电路 的 同时 ， 还 需 避 免 综 合 和 仿真 之 间 的 差异 。 以 下 是 组 合 逻 辑 电 路 的 编码 准则 : 


e 同一 变量 的 赋值 只 能 发 生 在 单一 的 always 块 中 ; 

e 组 合 逻 辑 电路 中 使 用 阻塞 赋值 ; 

e 使 用 @ * 自动 将 所 有 输入 包括 在 敏感 列表 中 ; 

e 确保 让 和 case 语句 涵盖 了 所 有 分 支 ; 

e 确保 在 所 有 分 支 中 ， 输 出 都 被 赋值 ; 

© 满足 之 前 的 两 个 准则 的 方法 之 一 是 在 always 块 的 开始 为 所 有 输出 指定 默 


e 用 代码 描述 full case 和 parallel case 语句 ， 而 不 是 用 软件 的 指令 或 属性 ; 
e 注意 由 不 同 的 控制 结构 产生 的 路 由 网 络 类 型 ; 
e 思考 硬件 结构 ， 而 不 是 C 代码 。 


3.8 参数 和 常量 


3.8.1 常量 


HDL 代码 中 经 常 在 表达 式 和 数组 边界 上 使 用 常数 值 。 这 些 值 在 模块 内 是 固 
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定 的 ， 不 能 被 修改 。 一 个 好 的 设计 实践 是 : 用 符号 常量 取代 “固定 值 ” 。 这 会 使 
代码 清晰 并 有 助 于 将 来 的 维护 和 修改 。 在 Verilog 中 ， 和 常量 可 以 使 用 localparam 
(“本 地 参数 ”) 关键 字 来 声明 。 例 如 ， 我 们 可 以 声明 一 个 数据 总 线 的 宽度 和 范 
围 : 
localparam DATA WIDTH =8, 
DATA RANGE =2 ж * DATA WIDTH - 1; 
或 者 定义 一 个 符号 端口 的 名 称 : 
localparam UART_PORT =4’ b0001, 
LCD_PORT -4' b0010, 
MOUSE PORT -4'b0100; 
声明 中 的 表达 式 ， 如 2 ** DATA-WIDTH-1， 会 在 预 处 理 时 被 计算 ， 因 此 并 
没有 推断 物理 电路 。 在 本 书 中 ,我 们 使 用 大 写字 母 表示 常量 。 
常量 的 用 法 最 好 通过 一 个 例子 来 说 明 。 思 考 下 面 进 位 加 法 器 的 代码 ,一 种 实 
现 手段 是 将 输入 位 宽 手 动 扩展 1 位 ， 执 行 常规 的 加 法 ， 并 将 和 的 最 高 位 作为 进 
位 。 代 码 如 示例 3.9 所 示 。 
示例 3.9 使 用 固定 名 字 的 加 法 器 


module adder carry hard lit 
( 
input wire [3: 0] a, b, 
output wire [3; 0] sum, 
output wire cout // 进位 
X3 
// 信号 声明 
wire [4: 0] sum ext; 
// 实体 
assign sum ext - {1° bO, a} + {1’ b0, bj; 
assign sum = sum. ext [3: 0]; 
assign cout =sum_ext [4]; 


endmodule 


这 是 一 个 4 位 加 法 器 的 代码 。 固 定位 宽 ,， 例如 用 3 和 4 表示 位 宽 范 围 ， 如 
wire [4: 0], sum ext [3: 0] 和 最 高 位 sum_ ext [4]。 如 果 我 们 想 把 它 修 改 成 
一 个 8 位 加 法 器 的 代码 , 不 得 不 手动 修改 这 些 名 字 。 如 果 代码 很 复杂 或 名 字 用 在 
许多 地 方 , 这 将 是 一 个 繁琐 且 容 易 出 错 的 过 程 。 
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为 了 提高 可 读 性 ， 我 们 可 以 使 用 符号 常数 N 来 表示 加 法 器 的 位 数 。 修 改 后 
的 代码 如 示例 3. 10 所 示 。 
示例 3. 10 ”使 用 常量 的 加 法 器 


module adder carry local par 
( 
input wire [3:0] a, b, 
output wire [3:0] sum, 
output wire cout // 进位 
)s 
// ЖШН] 
localparam N 24, 
NI ZN-1; 
// fi FAY 
wire [ N:0 | sum ext; 
// 实体 
assign sum ext = |1' b0, al + |1' bO, bi; 
assign sum = sum ext [ N10]; 
assign cout = sum ext [N]; 


endmodule 


常量 使 代码 更 易于 理解 和 维护 。 
3.8.2 参数 


Verilog 模块 可 以 被 实例 化 为 一 个 原件 ， 成 为 更 大 设计 的 一 部 分 ， 如 第 1.6 
节 所 讨论 的 。Verilog 提供 了 一 种 结构 ， 称 之 为 parameter (人 参数) ， 用 于 将 信息 传 
递 到 一 个 模块 。 这 种 机 制 使 得 该 模块 通用 性 和 可 重用 性 成 为 可 能 。 参 数 不 能 被 模 
块 内 部 修改 ， 因 此 它 的 功能 就 像 一 个 常数 。 
在 Verilog-2001 中 ，parameter 的 声明 部 分 可 以 被 添加 在 头 部 、 引 脚 声明 之 
前 。 其 简化 的 语法 如 下 : 
module [ module_name | 
#( 


parameter [ parameter name] = [ default_value ] , 


[ parameter name | = [ default value] ; 
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...//I/0 port declaration 
); 
例如 ， 前 面 的 加 法 器 代码 可 以 被 修改 为 使 用 参数 作为 加 法 器 宽度 ， 如 示例 
3. 11 所 示 。 
示例 3.11 使 用 参数 的 加 法 器 


module adder_carry_para 

#( parameter N =4) 

| | 
input wire [N-1;0] a, b, 
output wire [N 1:0] sum, 
output wire cout // JEZ 

14 

// 常量 声明 

localparam NI =N-1; 

// 信号 定义 

wire [ N:0 | sum ext; 

// ЗАК 

assign sum, ext = |1’b0, a! +11'b0, b}; 

assign sum =sum_ext| N1:0] ; 

assign cout = sum ext[ N ] ; 


endmodule 


N 被 声明 成 默认 值 为 4 的 参数 。N 被 声明 后 ， 可 以 像 常 数 一 样 应 用 于 端口 声 
明和 模块 主体 。 

如 果 加 法 器 后 续 用 于 其 他 代码 中 的 元 件 ， 可 以 在 例 化 元 件 时 将 期 望 的 值 赋值 
给 参数 ， 并 覆盖 默认 值 。 类 似 于 第 1. 6 节 中 讨论 的 端口 连接 ， 参 数 赋值 可 以 通过 
名 称 或 顺序 列表 的 方式 完成 。 第 1.6 节 中 讨论 的 顺序 列表 方式 存在 一 个 洪 在 问 
题 ， 本 书 会 坚持 使 用 按 名 称 赋 值 的 方式 。 如 果 参 数 的 赋值 被 省 略 ， 则 将 使 用 默认 
值 。 元 件 例 化 时 参数 的 使 用 如 示例 3. 12 所 示 。 

示例 3. 12 ”加 法 器 例 化 例子 


module adder_ insta 
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( 
input wire [3; 0] a4, b4, 
output wire [3: 0] sum4, 
output wire c4, 
input wire [7; 0] a8, b8, 
output wire [7: 0] sum8, 
output wire c8 
)s 
// 初始 化 8 TZ WIESE 
Adder. carry. parat (. № (8)) unitl 
(.a (a8),. b (b8),. sum (sum8),. cout (c8)) ; 
// 初始 化 4 fu Bliss 
Adder carry para unit2 
(.a (a4),.b (b4),.sum (sum4), . cout (c4)); 


endmodule 


参数 提供 了 一 种 创建 可 扩展 代码 的 机 制 ， 电 路 的 “位 宽 ” 可 以 调整 ， 以 满 
足 特定 的 需求 。 这 使 得 代码 更 具 可 移植 性 ， 并 促进 了 设计 重用 。 


3.8.3 Verilog-1995 的 参数 使 用 


前 面 讨 论 的 localparam 关键 字 ， 在 开头 声明 ， 且 通过 名 称 赋值 是 Verilog- 
2001 中 一 个 新 特性 。 在 Verilog-1995 中 ， 参 数 在 开头 之 后 声明 ， 并 且 只 能 使 顺序 
清单 方式 或 defparam 语句 重新 定义 。 男 外 ， 常 量 必须 声明 为 参数 ， 即 使 它们 不 
应 被 重新 定义 。Verilog-1995 语法 下 的 加 法 器 代码 实现 如 示例 3. 13 所 示 。 

示例 3. 13 Verilog-1995 参数 的 使 用 


module adder carry 95 (a, b, sum, cout) ; 
parameter N 24; // Etn ВРУ Н ARO 
parameter NI =N -1; // Æ Verilog 1995 中 无 localparam 声明 
input wire [ N1:0] a, b ; 
output wire [ N1;0] sum; 
output wire cout; 
// 信号 定义 
wire [ N:0 | sum_ext; 


// ЖЖ 
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assign sum, ext = |1' b0, aj + |1' bO,b] ; 
assign sum = sum ext [ Nl ;0] ; 
assign cout = sum ext [ММ]; 


endmodule 


当 一 个 模块 被 实例 化 时 ， 参 数 只 能 通过 顺序 列表 的 方式 重新 定义 ， 如 
adder carry 95 #(8,7) unitl 
(. a( a8) ,. b( b8) ,. sum(sum8) ,. cout (c8) ) 
或 者 通过 defparam 方式 ,如 
defparam unitl. N =8; 
defparam ипи. NI 27; 
adder-carry-95 unitl 
(. a(a8) ,. b( b8) ,. sum(sum8) ,. cout( c8) ) ; 
Verilog-1995 的 方案 比较 繁琐 ， 并 且 可 能 引入 细微 误差 ， 在 这 本 书 中 我 们 不 
使 用 它 。 


3.9 设计 实例 


3.9.1 7 段 LED 数码 管 十 六 进 制 译 码 器 


7 Be LED 显示 简 图 如 图 3-6a 所 示 。 它 由 7 个 LED 条 和 一 个 圆 形 的 LED 小 数 
点 组 成 。 在 开发 板 上 ,7 БЕТЕР 配置 为 低 电 平 有 效 ， 即 控制 信号 为 0 时 ，LED 点 


亮 。 


LES LN 


a) 七 段 LED 显 示 原 理 图 


ии иии ngoda hoo 
шии LUI ии] Jong иии 
) 十 六 进 制 数字 样式 


[3-6 -EBt LED 数码 管 显示 和 十 六 进 制 样式 
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7 Be LED 数码 管 十 六 进 制 译 码 器 将 4bit 输入 作为 十 六 进 制 数字 ， 译 码 成 相应 
的 LED 样式 ， 如 图 3-6b 所 示 。 出 于 完整 性 考虑 ， 我 们 假设 有 一 个 1bit 输入 信和 号 
dp， 直 接连 接 在 小 数 点 的 LED F. LED 控制 信号 dp. a, b. c, d. e, f Allg, 
被 组 合 为 一 个 独立 的 8bit sseg 信号。 代码 如 示例 3. 14 所 示 。 使 用 一 个 case 语句 
来 列 出 所 有 七 个 LSB 的 sseg 信号 样式 。MSB 连 至 DP, 
示例 3. 14 七 段 十 六 进 制 LED 数码 管 译 码 器 


module hex_to_sseg 

( 

input wire [3:0] hex, 

input wire dp, 

output reg [7:0] sseg // fj IC Ж 

ja 

always @ +* 

begin 

case (hex) 

4' hO:sseg [6: 0] 27' b0000001 ; 
4'hl:sseg [6:0] 27' b1001111; 
4' h2:sseg [6:0] =7’ b0010010; 
4' h3:sseg [6:0] =7’ b0000110; 
4' há:sseg [6:0] 27' b1001100; 
4' h5:sseg [6:0] =7’ b0100100; 
4' h6:sseg [6:01 =7’ b0100000; 
4' h7:sseg [6:0] =7'b0001ill ; 
4' h8:sseg [6:0] =7’ b0000000; 
4' hO:sseg [6:0] =7’ b0000100; 
4’ ha:sseg [6:0] =7’ b0001000; 
4’ hb:sseg [6:0] =7’ b1100000; 
4’ he:sseg [6:0] =7’ b0110001; 
4’ hd:sseg [6:0] =7’ b1000010; 
4’ he:sseg [6:0] =7’ b0110000; 
default : sseg [6:0] 27' b0111000; //4 "hf 








endcase 
sseg| 7 | = dp; 


endmodule 
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开发 板 上 共有 4 个 7 段 LED 显示 器 ， 为 了 节省 FPGA 芯片 的 VO 引 脚 的 数 
量 ， 使 用 分 时 复 用 机 制 。 分 时 复 用 模块 disp-mux 如 图 3-7a 所 示 。 输 入 是 ind, 
inl, in2 和 in3 ， 分 别 对 应 4 个 8 位 七 段 LED 的 数据 ， 输 出 是 一 个 4 位 信号 an, 
用 于 使 能 四 个 单独 的 显示 器 ，sseg 是 共享 的 8bit 信号 ， 用 于 控制 8 个 LED 段 。 
电路 产生 定时 使 能 信号 ， 将 4 个 输入 数据 交替 路 由 到 输出 端 。 该 模块 的 设计 将 在 
第 4 章 讨 论 。 现 在 ， 我 们 只 把 它 作为 一 个 需要 4 个 7 E LED 数据 的 黑 盒 子 ， 并 
在 代码 中 将 其 实例 化 。 


SW disp_mux 
> 


reset 


hex_to_sseg 





Ы b) 译 码 器 测试 电路 框图 
图 3-7 LED 分 时 选择 模块 和 译 码 器 测试 电路 
测试 电路 ”我们 使 用 一 个 简单 的 8 位 累加 电路 来 验证 译 码 器 的 操作 。 如 图 3- 
Tb 所 示 。 输 入 sw 是 开发 板 中 的 8 位 开关 。 它 被 反馈 到 一 个 累加 器 上 ， 用 于 获取 
sw+1。 原 始 和 累加 的 sw 信号 被 传递 至 4 个 译 码 器 中 ， 用 于 将 4 个 十 六 进 制 数字 
显示 在 7 Be LED 显示 器 上 。 代 码 如 示例 3. 15 所 示 。 
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示例 3.15 Hex-to-LED 解码 器 测试 电路 


module hex_to_sseg_test 

( 

input wire clk, 

input wire [7:0] sw, 

output wire [3:0] an, 

output wire [7:0] sseg 

); 

// 信号 定义 

wire [7:0] inc; 

wire [7: 0] ledO, ledl, led2, led3; 
// Sl AI 
assign inc 2 sw +1; 
// BALE VIS АЕА A 
ВИЕ Аа 个 最 低位 
Hex_to_sseg sseg_unit_0 
(.hex(sw[3:0]),.dp(1'b0),.sseg(led0)); 
// 例 化 输入 的 4 个 最 高 位 
Hex to sseg sseg unit 1 
(. hex( sw[7 :4]) ,. dp(1’ b0) ,. sseg(ledl) ) ; 
// 例 化 增 量 值 的 4 个 最 低位 

Hex_to_sseg sseg_unit 2 

(. hex(ine[3:0]),. dp(1’ bl) ,. sseg(led2) ) ; 
// 例 化 增 量 值 的 4 个 最 高 位 
Hex_to_sseg sseg_unit_3 
(. hex(ine[7:4]),. dp(1’ bl) ,. sseg(led3) ) ; 
// 例 化 7 ВЕТЕР 有 时间 码 显 示 模 块 
Disp_mux disp_unit 
(. elk( elk) ,. reset(1’b0),. in0(led0) ,. inl (ledl), 
. in2(led2) ,. in3(led3) ,. an(an) ,. sseg(sseg) ) ; 


endmodule 


可 以 将 第 2 章 中 的 程序 进行 综合 并 下 载 到 开发 板 上 。 注 意 ， 在 综合 过 程 
中 ， 含 有 定时 选择 模块 的 代码 disp-mux. у 文件 和 uef 约束 文件 必须 在 Xilinx ISE 
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工程 中 。 
3.9.2 “符号 一 幅 值 ”加 法 器 


整数 可 以 用 “符号 一 幅 值 ”格式 表示 ， 其 中 的 最 高 位 是 符号 ， 剩 余 位 表 
示 数 值 。 例 如 ,3 和 -3 可 以 用 4 位 的 符号 一 幅 值 格式 表示 为 “0011” 和 
“POLL” a 

“符号 一 幅 值 ”加 法 器 用 于 完成 这 种 格式 的 加 法 操作 ， 其 实现 方式 概述 如 
T: 

© 如 果 两 个 操作 数 的 符号 相同 ， 数 值 相 加 ， 符 号 保持 不 变 ; 

e 如 果 两 个 操作 数 的 符号 不 同 ， 从 较 大 的 数值 中 减 去 较 小 的 数值 ， 并 保持 
较 大 值 的 符号 。 

一 种 实现 方式 是 将 电路 行为 分 成 两 个 阶段 。 第 一 阶段 是 根据 数值 大 小 将 两 个 
输入 数据 分 为 max 信号 和 min 信号 。 第 二 阶段 查看 符号 位 ， 并 对 数值 进行 加 法 或 
者 减法 运算 。 需 要 注意 的 是 ， 由 于 两 个 信号 已 经 分 为 max 信号 和 min fri, max 
数值 总 是 大 于 min， 最 终 的 符号 是 max 的 符号 。 

代码 如 示例 3. 16 所 示 ， 它 采用 了 两 个 阶段 的 实现 方案 。 为 清晰 起 见 ， 我 们 
在 内 部 将 输入 数据 的 符号 和 数值 分 开 。 参 数 N 用 来 表示 加 法 融 的 宽度 。 

示例 3. 16 “符号 一 幅 值 ” 数 加 法 器 


module sign mag add 

# ( 

parameter N =4 

) 

( 
input wire [N-1;0] a, b, 
output reg [N —1:0 | sum 

); 

// 信号 定义 


reg [N-2:0] mag a, mag b, mag sum, max, min; 





reg sign a, sign b, sign sum; 
// 实体 
always @ * 
begin 
// 分 离 数据 和 符号 位 
mag_a=a[N-2:0]; 
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mag_b=b [N -2:0]; 
sign_a=a[N-1]; 
sign_b=b[N-1]; 
// NDE BEAL 
if (тав а> mag b) 
begin 
max = mag a; 
min = mag_b; 
sign sum = sign a; 
end 
else 
begin 
max = mag b; 
min = mag a; 
sign sum = sign b; 
end 
// Ж 
if (sign_a == sign b) 
mag sum = max + min; 
else 
mag sum = max — min; 
// 形成 输出 
sum = (sign sum, mag sum); 
end 


endmodule 


测试 电路 ”我 们 使 用 一 个 4 位 的 “符号 一 数值 ”加 法 器 来 验证 电路 是 否 正 
党 工作。 测试 电路 如 网 3-8 所 示 。 两 个 输入 数字 连接 至 8 位 开关 上 ， 符 号 和 数值 
显示 在 两 个 七 段 LED 数码 管 上 。 两 个 按钮 作为 选择 信号 的 多 路 开关 ， 将 操作 数 
或 和 数 路 由 至 显示 电路 。 最 右边 的 七 段 LED 显示 3bit 的 数值 ， 前 面 添加 了 一 个 
0， 并 送 到 十 六 进 制 七 段 LED 详 码 器 中 。 下 一 个 LED 显示 的 是 符号 位 ， 空 白 时 
表示 正 ， 亮 起 中 间 LED 段 表示 负 。 这 两 个 LED 显示 值 被 发 送 到 3. 9. 1 节 中 所 示 
的 时 分 复 用 模块 disp-mux 中 。 代 码 如 示例 3. 17 所 示 。 
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sign mag add 





图 3-8 “符号 一 幅 值 ”加 法 器 测试 电路 
示例 3. 17 “符号 一 幅 值 ” 加 法 器 测试 电路 


module sm. add test 

( 

input wire clk, 

input wire [1; 0] btn, 

input wire [7: 0] sw, 

output wire [3; 0] an, 

output wire [7; 0] sseg 

js 

// 信号 定义 

wire [3: 0] sum, mout, oct; 

wire [7: 0] led3, led2, ledl, ledO; 

// Jul: as 

Sign_mag_add # (. N (4)) sm adder unit 
(.a (sw [3: 0]), -b (sw [7: 4]), sum (sum)); 

// 数值 显示 在 最 右边 的 7 BELED 上 

assign тош = (Ып ==2”b00) ? sw [3: 0]: 
(btn ==2’ b01) ? sw [7: 4]: 

sum; 

assign oct = |l' bO, тош [2: 0]| ; 

// PAL EN TE aE 

Hex to sseg sseg unit 


(. hex (oct), .dp (1° БО), .sseg (led0)) ; 
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// 在 第 二 个 7 BLED 上 显示 符号 位 
// 中 间 LED 显示 负数 
assign ledl = mout [3] ? 8' bl1111110: 8’ b11111111; 
// 其 他 2 个 LED 231A 
assign led2 =8’ Ь11111111; 
assign led3 =8’ bl1111111; 
// МИЕ? 段 有 时 间 码 显示 LED 
Disp_ mux disp. unit 
(. clk (clk), . reset (1° БО), .inO (ledO), .inl (ledl), 
.in2 (led2), .in3 (led3), .an (an), .sseg (sseg)) ; 


endmodule 


3.9.3 桶 式 移 位 器 


虽然 Verilog 有 内 置 的 移 位 功能 ， 但 却 没 有 轮转 操作 。 在 本 节 中 ， 我 们 将 检 
验 一 个 可 以 让 任意 比特 数 的 数据 向 右 轮 转 的 8 位 桶 式 移 位 器 。 该 电路 具有 一 个 8 
位 的 数据 输入 端 a， 和 一 个 用 来 指定 旋转 量 的 3 位 控制 信号 amt。 第 一 个 设计 使 
用 了 case 语句 ， 详 尽 地 罗列 了 amt 信号 的 所 有 的 组 合 及 相应 的 轮转 结果 。 代 码 
如 示例 3. 18 所 示 。 
示例 3. 18 case 语句 的 桶 式 移 位 器 


module barrel_shifter_case 
( 
input wire [7:0] a, 
input wire [2:0] amt, 
output reg [7:0] y 


ji 

// 实体 

always @ * 

case ( amt) 
3'00: y za; 
3'01: у= {а[0], a[7:1]] ; 
3'02: у= {а[1:0], a[7:2]] ; 
3'03: у= 1a[2:0], a[7:3]] ; 
3'04: y= la[3:0], a[7:4]] ; 
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3'05: y 21a[4:0], a[7:5]1 ; 

3°06: у= {а[5:0], a[7:6]] ; 

default : y = |a[6:0] , a[7]] ; 
endcase 


endmodule 


虽然 代码 很 简单 ， 但 是 随 着 数据 位 数 的 增加 ， 代 码 会 变 得 很 元 长 。 另 外 ， 带 
有 大 量 分 支 项 的 case 语句 意味 着 很 宽 的 多 路 选择 器 ， 这 会 使 得 综合 变 的 困难 ， 
并 导致 很 大 的 传播 延迟 。 作 为 选择 ， 我 们 可 以 分 级 构造 电路 。 在 第 立 级， 输入 信 
号 或 被 直接 传递 到 输出 ， 或 者 向 轮转 “2"” 个 位 置 。 第 nn 级 通过 amt 的 信号 的 第 
n 位 控制 。 假 设 3bit 的 amt 为 mmimo。 经 过 三 级 的 轮转 总 量 是 m,22 + m2! + 
mo2" ， 正 是 期 望 的 轮转 总 量 。 本 方案 的 代码 如 示例 3. 19 所 示 。 
示例 3. 19 ”多 级 桶 式 移 位 器 


module barrel_shif ter_stage 

( 

input wire [7:0] a, 

input wire [2:0] amt, 

output wire [7:0] y 

); 

// 信号 定义 

wire [7:0] s0, sl; 

// 实体 

//stage 0 , 0 位 或 1 位 

assign s) =amt [0] ? {a[0], a[7:1]] :a; 

//stage 1 ,#£0 位 或 2 位 

assign sl =amt [1] ? {s0[1:0], s0[7:2]| :s0; 

// stage 2 , #60 位 或 4 位 

assign y=amt [2] ? 1s1[3:0], sl[7:4]] :sl; 
endmodule 


测试 电路 ”要 测试 这 个 电路 ， 我 们 可 以 使 用 8 位 的 开关 作为 a 信 号 ，3 个 按 
钮 当 作 amt 信号 ，8 个 分 立 的 LED 灯 用 于 输出 。 不 用 重新 编写 引 脚 分 配 约 柬 文 
件 ， 我 们 创建 一 个 新 的 HDL 文件 将 桶 式 移 位 器 电路 封装 起 来 ， 并 将 它 的 信号 映 
射 到 原型 设计 电路 板 的 信号 上 。 代 码 如 示例 З. 20 所 示 。 
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示例 3.20 桶 式 移 位 器 测试 电路 


module shif ter test 
( 
input wire [2:0 |btn, 
input wire [7:0] sw, 
output wire [7:0] led 
3% 
// PEE A Lai 
barrel shifter stage shift. unit 
(. a( sw) ,. amt( btn) ,. y(led) ) ; 


endmodule 


3.9.4 ”简化 的 浮 点 加 法 器 


浮 点 数 是 用 来 表示 数据 另 一 种 格式 。 在 相同 的 比特 数 的 情况 下 ， 浮 点 数 格式 
的 表示 范围 远 远 大 于 有 符号 整 型 数 格 式 。 昌 然 VHDL 具有 内 置 的 浮 点 数据 类 型 ， 
但 是 它 实在 太 复 杂 ， 无 法 被 自动 综合 。 

对 浮 点 数 表示 方法 的 详细 讨论 已 经 超出 了 本 书 的 范围 。 本 例 使 用 了 一 个 简化 
的 13 位 格式 ， 并 忽略 其 舍 人 误差 。 这 种 表示 方法 包含 一 个 符号 位 s， 表 示 数 字 的 
符号 (1 表示 负数 ) ; 一 个 4 位 的 指数 域 e， 它 表示 指数 ; 一 个 8 位 的 尾数 字段 了 
它 代 表 有 效 位 数 或 小 数 。 在 这 种 格式 中 ， 浮 点 数 的 值 是 ( -1)'*=.f= 2°, f = 2° 
是 数字 的 幅 值 ，( -1) 只 是 一 种 表示 符号 的 正规 方式 ， 说 明 “* 等 于 1 意味 着 一 
个 负数 。” 由 于 符号 位 是 从 数字 的 剩余 部 分 分 离 出 来 的 ， 浮 点 表示 法 可 以 看 作为 
“符号 -数值 ”格式 的 一 种 演变 。 

我 们 还 可 以 做 如 下 假设 : 

e 指数 和 尾数 域 都 是 无 符号 格式 的 ; 

© 数值 的 表示 必须 为 正规 方式 或 为 零 ， 正 规 方式 表示 意味 着 有 效 字段 的 
MSB 必须 为 1， 如 果 计 算 结 果 的 数值 小 于 最 小 的 非 零 数 值 0. 10000000 * 2°, у, 
必须 将 它 转 换 为 零 。 

基于 这 些 假设 ， 最 大 和 最 小 的 非 零 幅 值 为 0.11111111 ж 2 和 0. 10000000 
ж 299 ， 范 围 约 为 26 (RJ (0.11111111  2"")7(0. 10000000 * 2%%)), 

我 们 的 浮 点 加 法 器 设计 遵循 了 用 科学 记 数 法 手动 相 加 数字 的 过 程 。 这 个 过 程 
可 以 通过 具体 实例 来 说 明 。 假 设 指数 和 尾数 的 宽度 分 别 为 2 个 和 1 个 数字 。 为 了 
便于 理解 ， 我 们 使 用 十 进 制 格式 。 几 个 有 代表 性 的 实例 计算 如 图 3-9 所 示 。 数 值 
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的 计算 通过 4 个 主要 步骤 完成 : 

排序 Xr An / S 规范 化 

示例 .1 +0.54E3 —0.87E4 . -0.87E4 一 0.87E4 — 0.87Е4 
— 0.87Е4 40.54E3 +0.05Е4 +0.05Е4 +0.05Е4 

—0.82Е4 —0.82E4 

示例 .2 +054ЕЗ -0.5SE3 -0.55Е3 —0.55E3 —0.55E3 
—0.55E3 +0.54E3 +0.54E3 +0.54E3 40.54E3 

—0.01E3 ~0.10E2 

示例 .3 +0.54E0 -0.55E0  -—0.55E0 —0.55E0 —0.55Е0 
-0.55E0 +0.54Е0 +0.54E0 +0.54E0 +0.54E0 

—0.01E0 —0.00Е0 





示例 .4 +056ЕЗ +0.56E3 +0.56E3 +0.56E3 *0.56E3 
+0.52Е3 +0.52Е3 +0.52E3 +0.52E3 +0.52E3 
+1.07E3 +0.10E4 











Kd 3-9 浮 点 数 加 法 实例 


1) 排序 : 把 数值 较 大 的 数字 放 在 顶部 ， 数 值 较 小 的 数字 放 在 底部 我们 称 
排序 后 的 数 为 “大 数 ” 和 “小 数 ” ) ; 

2) 对 齐 : 对 齐 两 个 数字 ,使 它们 具有 相同 的 指数 。 可 以 通过 调整 “小 数 ” 
的 指数 去 匹配 “大 数 ” 的 指数 来 做 到 。 根 据 指数 的 差异 右 移 小 数字 的 尾数 ; 

3) 加 / 减 : 加 上 或 减 去 两 个 对 齐 的 数字 的 有 效 数 字 ; 

4) 规范 化 : 调整 结果 到 规范 格式 。 有 三 种 类 型 的 规范 化 过 程 : 

e 做 完 减 法 运算 后 ， 结 果 可 能 包含 前 面 的 数 为 0 的 情况 ， 如 图 3-9 中 示例 2 
所 示 ; 

e 做 完 减 法 运算 后 ， 结 果 可 能 太 小 而 无 法 被 规范 化 的 情况 ， 这 样 就 需要 被 
转换 为 零 ， 如 图 3-9 中 示例 3 所 示 ; 

e 做 完 加 法 运算 后 ， 结 果 可 能 会 产生 进位 ， 如 图 3-9 中 示例 4 所 示 。 

二 进 制 浮 点 加 法 器 的 设计 采用 了 类 似 的 算法 。 为 了 简化 过 程 ， 我 们 忽略 了 爹 
入 ， 在 对 齐 和 规范 化 过 程 中 ， 当 有 效 位 数 的 低 比特 位 被 移出 时 将 被 丢弃 。 设 计 分 
为 4 个 阶段 ， 每 个 阶段 对 应 上 述 算法 中 的 步骤 。 信 号 名 称 后 级 中 使 用 的 "b’、 
sla’ r. n, 分 别 表 示 “ 大 数 ”"、“ 小 数 ”"、“ 对 齐 的 数 ”"、“ 加 /减法 结 
果 ” 以 及 “规范 化 的 数 ”。 根据 这 些 阶 段 来 设计 代码 ， 如 示例 3.21 所 示 。 
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示例 3.21 简单 浮 点 数 加 法 器 


module fp. adder 
( 
input wire signl, sign2, 
input wire [3:0] expl, exp2, 
input wire [7:0 ]fracl, frac2, 
output reg sign out, 


output reg [3:0] exp out, 








output reg [7:0] бас out 

jt 

// 信号 定义 

// 信号 名 称 后 绥 中 使 用 的 吨 "，s ,aa ,站 分 别 表 示 
// “大 数 "“ 小 数 "“ 邓 章 的 数 " 以 及 "规范 化 的 数 ” 
regsign b, signs; 

reg [3:0] expb, exps, expn, exp diff; 

reg [7:0] fracb, fracs, fraca, fracn, sum norm; 
reg [8:0] sum; 

reg [2:0] lead0; 

// Sch 

always @ x 

begin 

// 第 一 步 :排序 找到 大 数 

if ( | expl ,fracl} > | exp2, frac2] ) 

begin 

signb = signl ; 

signs = sign2 ; 

expb = expl ; 

exps = exp2 ; 

fracb = fracl ; 

fracs = frac2 ; 

end 

else 

begin 

signb = sign2 ; 


- 84 · 用 Verilog 设计 FPGA 样机 实例 解析 (Xilinx Spartan-3 版 ) 





signs = signl ; 
expb = exp2; 
exps = expl ; 
fracb = frac2 ; 
fracs = fracl ; 
end 

// 第 二 步 :对 齐 小 数 

exp_diff = expb_exps; 

fraca = fracs >> exp_diff; 

// S8 22: П Ж 

if (signb == signs) 

sum = | 1° bO,fracb| + | 1' bO, fraca); 
else 

sum = | 1° bO,fracb) — | 1' bO, fraca! ; 
// FAB KLANG 

// 查 高 位 0 的 个 数 

if (sum[7]) 
lead0 =3'o0; 
else if (sum| 6 | ) 
lead0 =3’ ol; 
else if (sum| 5] ) 
lead0 23' 02; 
else if (sum[ 4] ) 
lead0 =3 03; 
else if ( sum[3]) 








lead0 =3 04; 
else if (sum[2]) 
lead0 23' 05; 
else if (sum[ 1 | ) 
lead0 23" 06; 
else 


lead0 =3 07; 
// 根据 高 位 0 ff 
sum norm = sum << lead0 ; 


// FEIR la oa PESCE 
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if (sum[8]) // 带 进 伺 ;将 fac BBA M 
begin 
expn = expb +1; 


fracn =sum|[ 8:1] ; 


end 
else if (lead0 > expb) // 太 小 不 需 格 式 化 
begin 
expn 20; // 种 为 0 
fracn =0; 
end 
else 
begin 


expn = expb - lead0; 
fracn 2 sum, norm; 

end 

// 形成 输出 

sign out = signb; 

exp. out = expn; 

тас out = fracn; 

end 


endmodule 


电路 在 第 一 阶段 是 比较 幅 值 ， 并 将 “大 数 ” 发 送 至 信号 signb expb 和 
fracb, 将 “小 数 ” 发 送 至 信号 signs, exps 和 fracs。 数 值 的 比较 在 expl&fracl 和 
exp2&frac2 之 间 完 成 。 这 意味 着 指数 是 最 先进 行 比较 的 ， 如 果 相 同 ， 再 进行 底数 
的 比较 。 

电路 在 第 二 阶段 进行 对 齐 操作 。 它 首先 计算 两 个 指数 之 间 的 差异 ， 即 expb- 
exps， 然 后 将 底数 fracs 向 右 移 位 expb-exps 位 。 对 齐 的 底数 被 标记 为 fraca。 电 路 
在 第 三 阶段 执行 幅 值 的 加 法 ， 加 法 运算 与 3. 9. 2 节 相 似 。 注 意 ， 操 作 数 被 扩展 了 
1 位 ， 用 于 放置 进位 。 | 

电路 在 第 四 阶段 执行 规范 化 操作 ， 调 整 结果 使 最 终 的 输出 与 规范 格式 相 一 
致 。 规 范 化 电路 由 三 段 代 码 构成 。 第 一 段 计 算 起 始 为 0 的 个 数 。 有 点 像 一 个 优先 
编码 器 。 第 二 段 对 底数 进行 左 移 操作 ， 移 位 位 数 由 起 始 为 0 的 计数 电路 确定 。 最 
后 一 段 检 查 进位 和 置 0 条 件 ， 并 生成 最 终 的 规范 化 数 。 

测试 电路 ” 浮 点 加 法 器 有 两 个 13 位 的 输入 操作 数 。 由 于 原型 板 只 有 8 位 开 
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关 和 4 个 1 位 按钮 ， 无 法 提供 足够 数量 的 物理 输入 来 测试 这 个 电路 。 为 了 提供 浮 
点 加 法 器 的 26 位 输入 ， 我 们 必须 创造 一 个 测试 电路 ， 将 常量 或 复制 的 开关 信和 号 
赋予 加 法 器 的 输入 操作 数 。 具 体 的 例子 如 示例 3. 22 所 示 。 给 一 个 操作 数 赋值 党 
量 ， 另 一 个 使 用 复制 的 开关 信和 号。 加 法 结果 传递 到 十 六 进 制 译 码 器 和 符号 电路 
中 ， 并 在 七 段 LED 数码 管 上 显示 。 

ANB 3.22 浮 点 加 法 器 测试 电路 


module fp_adder_test 
( 
input wire clk, 
input wire [1:0] btn, 
input wire [7:0] sw, 
output wire [3:0] an, 
output wire [7:0] sseg 
ay 
// 信号 定义 
wire signl , sign2, sign out; 
wire [3:0] expl, exp2, exp. out; 
wire [7: 0] fracl, frac2, frac out; 
wire [7: 0] led3, led2, ledl, led0; 
// 实体 
// 建立 tp 地 址 输入 信号 
assign signl =1” b0; 
assign expl =4’ b1000; 
assign fracl = |1' bl, sw[1:0], 5’b10101} ; 
assign sign2 = sw[ 7] ; 
assign exp2 = btn; 
assign frac2 = |l' bl, sw[6:0]] ; 
// fp 地 址 例 化 
fp_adder_ fp unit 
(. signl ( signl ) ,. sign2( sign2) ,. expl ( expl) ,. exp2(exp2) , 
. fracl (fracl) ,. Frac2( frac2) ,. sign out(sign out) , 
. exp. out( exp. out) ,. frac_out( frac_out) ) ; 
//3 个 16 Ell ERA ЛИ SHE 


hex to sseg  sseg unit 0 
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(. hex(exp_out) ,. dp( 1' b0) ,. sseg( led0) ) ; 
//ALSBs 的 部 分 
hex_to_sseg sseg_unit_l 

(. hex(frae out[3:0]) ,. dp(1' bl) ,. sseg(led1) ) ; 
//AMSBs 有 的 部 分 
hex to sseg sseg_unit_2 

(. hex(frac. out[ 7:4] ) ,. dp( 1 ' b0) ,. sseg( led2) ) ; 
// 符号 位 
assign led3 = (sign out) ? 8' b11111110:8' b11111111 
// SAAC BELED 显示 时 分 复 用 模块 
Disp mux disp unit 

(. elk( elk) ,. reset( 1? bO) ,. inO(ledO) ,. inl (ledl), 
. in2(led2) ,. in3(led3) ,. an(an) ,. sseg(sseg) ) ; 


endmodule 


3.10 文献 备注 


S. Palnitkar 编著 的 《Verilog HDL, 2nd edition) 和 M. D. Ciletti 编著 的 (Star- 
ter' s Guide to Verilog2001) Xf Verilog 语言 的 语法 和 结构 进行 了 详细 的 说 明 。 
S. Sutherland 的 文章 《The IEEE Verilog 1364-2001 Standard: What's New, and 
Why You Need It) 对 新 特性 进行 了 总 结 。C. E. Cummings 的 文章 《“full-case par- 
allel-case" , the Evil Twins of Verilog Synthesis) 对 full-case 和 parallel-case 语句 使 
用 过 程 中 的 注意 事项 进行 了 讨论 ， 他 的 另 一 篇 文章 “New Verilog-2001 Techniques 
for Creating Parameterized Models" 讨论 了 Verilog-2001 新 的 参数 传递 机 制 的 优势 。 


3.11 实验 


3.11.1 多 功能 桶 式 移 位 器 


思考 一 个 能 够 完成 循环 左 移 或 右 移 的 8 位 移 位 电路 。 另 外 一 个 1bit 控制 信号 
1r， 用 于 指定 移 位 方向 。 

1) 设计 一 个 电路 ， 使 用 一 个 循环 右 移 电 路 ， 一 个 循环 左 移 电路 和 一 个 二 选 
一 多 路 选择 器 来 选择 期 望 的 结果 ， 编 写 代 码 ; 

2) 编写 一 个 testbench 并 使 用 testbench 进行 仿真 ， 验 证 代码 的 运行 情况 ; 
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3) 对 代码 进行 综合 ， 并 实现 到 FPGA 开发 板 中 ， 然 后 验证 它 的 运行 情况 ; 

4) 这 个 电路 也 能 通过 一 个 带 有 预 反 转 和 后 反 转 的 循环 右 移 电路 实现 ， 反 转 
电路 可 将 输入 进行 传递 或 反 转 ( 如 假设 一 个 8 位 输入 是 a7a6a5a4a3a2ala0， 反 转 
的 结果 变 成 了 a0ala2a3a4a5a6a7) ， 重 复 步骤 2) ~3) DR; 

5) 检查 报告 并 比较 这 两 种 设计 的 逻辑 单元 数量 和 传输 延 时 ; 

6) 修改 代码 将 电路 位 宽 扩展 到 16 位 并 综合 代码 ， 重 复 步骤 1) ~ 步骤 5)。 

7) 修改 代码 将 电路 位 宽 扩 展 到 32 位 并 综合 代码 ， 重 复 步骤 1) ~ 步骤 5) 。 


3.11.2 双 优 先 级 编码 器 


双 优 先 级 译 码 器 返回 最 高 或 次 高 优先 级 请 求 的 编码 。 输 入 是 一 个 12 位 的 请 
求 信号 ， 输 出 是 第 一 和 第 二 ， 位 宽 为 4bit， 分 别 是 最 高 或 次 高 优先 级 请 求 的 二 进 
制 编码 。 

1) 设计 这 个 电路 并 编写 代码 ; 

2) 编写 一 个 testbench 并 使 用 testbench 进行 仿真 ， 验 证 代码 的 运行 情况 ; 

3) 设计 一 个 测试 电路 ， 用 于 在 开发 板 上 的 七 段 LED 上 显示 输出 ， 编 写 代 
码 ; 

4) 综合 代码 得 到 电路 ， 加 载 到 FPCA 中 ， 验 证 它 的 运行 情况 。 


3.11.3 BCD 码 增 量 器 


二 进 制 编码 的 十 进 制 (BCD) 格式 用 4 位 二 进 制 数 表示 十 进 制 数 。 例 如 ， 
259,, 用 二 进 制 编码 的 十 进 制 (BCD) 格式 表示 为 “0010 0101 1001”, BCD iit 
器 使 用 BCD 格式 对 一 个 数 加 1。 例 如 ， 增 加 后 ，“0010 0101 1001” (也 就 是 ， 
259,,) 变 为 “0010 0110 0000”( 也 就 是 ，260,6)。 

1) 设计 一 个 3 个 数字 的 12 位 增 量 器 并 编写 代码 ; 

2) 编写 一 个 testbench 并 使 用 testbench 进行 仿真 ， 验 证 代码 的 运行 情况 ; 

3) 设计 一 个 测试 电路 用 来 在 七 段 LED 上 显示 这 3 个 数字 ， 并 编写 代码 ; 

4) 综合 代码 得 到 电路 ， 加 载 到 FPGA 中 ， 验 证 它 的 运行 情况 。 


3.11.4 浮 点 数 大 于 比较 电路 


一 个 浮 点 数 比 较 电 路 比较 两 个 浮 点 数 ， 当 第 一 个 数 大 于 第 二 个 数 时 置 位 输出 
信号 gt。 假 设 两 个 数据 格式 使 用 3. 9. 4 节 所 讨论 的 格式 表示 。 

1) 设计 这 个 电路 并 编写 代码 ; 

2) 编写 一 个 testbench 并 使 用 testbench 进行 仿真 ， 验 证 代码 的 运行 情况 ; 

3) 设计 一 个 测试 电路 并 编写 代码 ; 

4) 综合 代码 得 到 电路 ， 加 载 到 FPGA 中 ， 验 证 它 的 运行 情况 。 


第 3 章 寄存 器 传输 级 组 合 逻辑 电路 . 89. 





3.11.5 浮 点 数 和 有 符号 整 型 数 转换 电路 


在 一 个 大 的 系统 中 ， 数 据 可 能 需要 转换 到 不 同 的 格式 。 例 如 我 们 在 3. 9. 4 节 
中 使 用 的 用 于 表示 浮 点 数 的 13 位 格式 和 用 于 表示 整 型 数 的 8 位 有 符号 数据 类 型 。 
整 型 数 到 浮 点 数 的 转换 电路 将 一 个 输入 的 8 位 整 型 数 转换 为 规范 格式 的 13 位 浮 
点 数 输 出 。 浮 点 数 转换 到 整 型 数 的 转换 电路 操作 相反 。 由 于 浮 点 数 的 表示 范围 非 
常 大 ， 转 换 可 能 导致 数据 下 滋 的 情况 (也 就 是 转换 后 的 数 的 幅 值 比 “00000001” 
要 小 ) 或 者 上 洲 的 情况 (也 就 是 转换 后 的 数据 的 幅 值 大 于 “01111111”)。 

1) 设计 一 个 整 型 数 到 浮 点 数 的 转换 电路 并 编写 代码 ; 

2) 编写 一 个 testbench 并 使 用 testbench 进行 仿真 ， 验 证 代码 的 运行 情况 ; 

3) 设计 一 个 测试 电路 并 编写 代码 ; 

4) 综合 代码 得 到 电路 ， 加 载 到 FPGA 中 ， 验 证 它 的 运行 情况 ; 

5) 设计 一 个 浮 点 数 到 整 型 数 的 转换 电路 。 除 8 位 的 整 型 数 输出 外 ， 这 个 设 
计 还 应 该 包括 2 个 状态 信号 uf 和 of 用 来 表示 下 洲 和 上 洲 状 态 。 编 写 代 码 并 重复 
步骤 2) ~ 步骤 4)。 


3.11.6 增强 型 浮 点 型 加 法 器 


3.9. 4 节 中 的 浮 点 型 加 法 咒 在 低位 移出 〈 认 为 是 恢复 为 0) 时 ， ATIR 
位 。 一 个 更 精确 的 方法 是 使 用 就 近 舍 人 的 方式 ， 像 IEEE 标准 中 定义 的 二 进 制 浮 
点 数 算术 一 样 〈 正 FE-754 标准 ) 。 这 一 方法 的 实现 需要 3 个 额外 的 位 ， 分 别称 之 
为 guard, round 和 sticky。 如 果 之 前 学 过 浮 点 数 的 算法 ， 那 么 可 以 修改 3.9.4 节 
中 的 浮 点 数 加 法 器 ， 使 其 适用 就 近 舍 人 方法 。 
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4.1 简介 


时 序 电 路 是 带 有 存储 器 的 电路 ， 这 些 存储 器 能 够 产生 电路 的 内 部 状态 ， 时 序 
电路 与 组 合 电路 的 差别 是 ， 组 合 电路 的 输出 仅 与 输入 有 关 ， 而 时 序 电路 的 输出 不 
仅 与 输入 有 关 ， 而 且 还 与 内 部 的 状态 有 关 。 同 步 设计 方法 学 是 设计 时 序 电 路 最 党 
用 的 方法 。 在 同步 设计 方法 学 中 ， 所 有 的 存储 元 件 都 被 一 个 全 局 时 钟 信号 控制 
(同步 )， 并 且 数 据 的 采样 和 存储 都 在 这 个 全 局 时 钟 的 上 升 沿 和 下 降 沿 上 进行 。 
这 就 使 得 设计 者 们 能 够 把 存储 器 件 从 电路 中 分 离 出 来 ， 从 而 大 大 简化 开发 过 程 。 
同步 设计 方法 学 是 开发 大 规模 复杂 数字 系统 中 最 为 重要 的 原则 ， 同 时 也 是 绝 大 多 
数 综合 、 验 证 和 测试 算法 的 基础 。 本 书 中 所 有 的 设计 都 遵循 同步 设计 方法 学 。 


4.1.1 D 触发 器 和 寄存 器 


时 序 电路 中 最 基本 的 存储 器 件 是 D 触发 器 (DFF)。 上 升 沿 触发 D 触发 器 的 
表示 符号 和 功能 表 如 图 4-1a 所 示 。D 信号 的 值 将 在 elk 信号 的 上 升 沿 被 采样 并 存 




















elk q* reset elk q* 
d q 0 q d q 1 = 0 
> clk i ë b clk 0 0 q 
{ d reset 0 | q 
0 $ 
a) DFF b) 带 同步 复位 的 DFF 

reset elk en q 

l - 0 

0 Ü q 

0 1 q 

0 $ 0 q 

0 $ 1 d 





c) 带 同步 使 能 的 DFE 
图 4-1 DFF 的 图 示 和 真 值 表 
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储 到 触发 器 中 。D 触发 器 可 能 会 包含 一 个 异步 复位 信号 ， 用 于 将 触发 器 清 零 。 这 
样 的 带 异 步 复位 端口 的 D 触发 器 的 表示 符号 和 功能 表 如 图 4-1b 所 示 。 

DFF 主要 有 3 个 时 间 参 数 ， 分 别 是 : Teg (clk 到 q 端的 延迟 ) Tsetup (建立 
时 间 ) 和 Thold (保持 时 间 ) 。Ted 表示 的 是 在 时 钟 上 升 沿 信号 从 d 端 传播 送 到 qd 端 
所 需要 的 时 间 ， 为 了 避免 触发 器 进入 亚 稳 态 ，d 信和 号 必须 在 采样 时 钟 沿 附近 处 于 稳 
定 状态 。Tsetup 和 Thold 分 别 指定 了 数据 信号 距离 采样 沿 前 后 的 稳定 时 间 间 距 。 

一 个 D 触发 器 能 够 提供 1bit 数据 的 存储 ， 知 干 个 D 触发 器 可 以 组 合 在 一 起 ， 
用 于 存储 多 比特 数据 ， 称 之 为 寄存 器 。 


4.1.2 同步 系统 


图 解 : 图 4-2 是 同步 系统 的 框图 ,包括 以 下 几 部 分 : 

e 状态 寄存 器 : 由 同一 个 时 钟 信号 控制 的 D 触发 器 集合 ; 

e KAA: 利用 外 部 输入 和 内 部 状态 〈 如 寄存 器 的 输出 ) 来 决定 寄存 器 
新 值 的 组 合 逻 辑 ; 

e fid: 产生 的 输出 信号 的 组 合 逻辑 。 


外 部 
输入 





clk 


图 4-2 同步 时 序 电 路 的 图 示 

最 高 运行 频率 ”时 序 电 路 的 设计 难点 之 一 是 确保 系统 时 序 没有 违反 建立 保持 
¿a у ола ee ae ==] 
寄存 器 。 我 们 须 对 单个 存储 器 件 进行 时 序 分 析 。 

时 序 电路 最 具 代 表 性 的 时 序 参数 是 最 大 时 钟 频率 记 .， 它 是 电路 最 快运 行 速 
率 的 指标 。f,,, 的 倒数 是 最 小 时 钟 周期 Tu ， 即 两 次 采样 时 钟 沿 之 间 的 时 间 间 隔 。 
为 了 确保 运行 的 正确 性 ， 下 一 状态 值 必 须 在 最 小 时 钟 周期 内 产生 并 稳定 下 来 。 假 
设 下 一 状态 逻辑 的 最 大 传输 延迟 为 7,,,,， 则 最 小 时 钟 周期 可 以 通过 累加 闭环 电 
路 的 传播 延迟 和 建立 时 间 约 柬 获 得 ， 如 图 4-2 所 示 。 

дев = Lat Тв TTia 
它 的 倒数 即 为 最 大 时 钟 频率 : 
£s Y .. l 
= dau wlan ass 
Xilinx 时 序 约束 在 综合 过 程 中 ，Xilinx 软件 会 对 综合 后 的 电路 进行 分 析 并 在 
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综合 报告 中 报告 /指标 。 我 们 可 以 设置 期 望 的 运行 频率 作为 综合 约束 ， 综 合 软 
件 将 会 尝试 构造 满足 频率 要 求 〈( 即 户 , 等 于 或 者 远大 于 期 望 运行 频率 ) 的 电路 。 
例如 ， 如 果 我 们 在 开发 板 上 使 用 50MHz (周期 20ns) 的 晶振 作为 时 钟 源 ， 那 么 
时 序 电路 时 钟 的 最 大 频率 /必须 超过 50MHz，( 周期 必须 比 20ns 小 )。 可 以 在 
时 序 约束 文件 中 加 上 以 下 了 几 和 名: 

NET "clk" TNM_NET = "сік" ; 

TIMESPEC "TS_clk" = PERIOD "clk" 20 ns HIGH 50% ; 

它 表 示 这 个 时 钟 信号 有 20ns 的 周期 (50MHz) LAK 50% 的 占 空 比 。 

综合 以 后 ， 我 们 可 以 调用 ISE 软件 “Processes” 窗 口 的 View Design Summary 
查看 相关 的 时 序 信息 。 其 中 ，Timing Constraints 部 分 展示 了 所 施加 的 约束 是 否 得 
到 满足 ，Static Timing Report 部 分 提供 了 更 加 详细 的 时 序 信 息 。 


4.1.3 代码 开发 


我 们 的 代码 开发 遵循 了 图 4-2 所 示 的 基本 框图 。 关 键 是 将 存储 器 件 ( 比如 寄 
存 器 ) 从 系统 分 隔 出 来 。 一 旦 寄存 器 被 孤立 出 来 ,余下 的 部 分 便 是 一 个 纯 组 合 
电路 ， 前 面 章节 讨论 的 代码 和 分 析 方 法 就 可 以 得 到 相应 的 应 用 了 。 虽 然 这 个 方法 
可 能 有 时 会 让 编码 变 得 有 点 复杂 ， 但 却 能 够 帮助 我 们 更 好 地 呈现 电路 结构 ， 避 免 
一 些 无 意识 的 存储 和 一 些微 小 的 错误 。 

根据 次 态 逻 辑 的 特点 ， 我 们 把 时 序 电 路 划分 为 三 类 ， 

e 常规 时 序 电 路 : 在 这 类 电路 中 ， 状 态 转移 呈现 “有 规则 ”的 变化 模式 ， 
如 计数 器 、 移 位 寄存 器 等 ， 次 态 逻 辑 主要 通过 一 个 预先 设计 的 、“ 有 规则 ”的 元 
件 构建 ， 如 增 量 器 或 者 移 位 器 ; 

e FSM: 这 类 电路 的 状态 转移 通常 不 会 呈现 一 种 简单 、 重 复 的 模式 ， 次 态 
逻辑 由 “随机 逻辑 ”来 构造 ， 并 从 无 到 有 开始 综合 ， 应 该 称 之 为 随机 时 序 电路 ， 
但 通常 称 之 为 FSM (有 限 状态 机 ) ; 

e FSMD: 电路 由 常规 时 序 电 路 和 FSM 两 部 分 构成 ， 这 两 部 分 分 别 被 称 为 数 
据 路 径 和 控制 路 径 ， 完 整 的 电路 被 称 为 FSMD (包含 有 数据 路 径 的 FSM) ， 这 类 
电路 一 般 用 于 使 用 寄存 器 传输 (RT) 方法 学 实现 某 种 算法 ， 寄 存 器 传输 (RT) 
方法 学 通过 一 系列 的 数据 传输 和 对 寄存 器 的 控制 描述 系统 的 运行 ; 

e 这 三 类 电路 将 在 本 章 以 及 后 两 章 中 进行 介绍 。 


4.2 触发 器 和 寄存 器 的 HDL 代码 


用 HDL 描述 存储 器 件 是 一 个 很 小 的 过 程 ， 可 以 通过 很 多 途径 实现 。 实 际 上 ， 
菜鸟 HDL 设计 师 最 常 遇 到 的 一 个 问题 是 产生 非 预 期 的 锁 存 器 和 缓冲 器 。 我 们 对 
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一 些 常用 的 存储 元 件 提供 了 代码 模板 ， 用 于 代替 覆盖 语意 的 可 能 形式 。 由 于 开发 
过 程 将 寄存 器 和 组 合 逻 辑 电路 进行 了 分 离 ， 本 书 中 这 些 元 件 对 于 设计 来 说 已 经 足 
够 用 了 。 这 些 元 件 是 : 

e 触发 器 ; 

e 寄存 器 ; 

e 寄存 器 文件 。 

所 有 的 代码 模板 都 是 使 用 阻塞 赋值 。 如 З. 3. 2 节 描 述 的 那样 ， 描 述 存储 元 件 
应 使 用 非 阻塞 赋值 ， 非 阻塞 赋值 的 语法 如 下 : 
[ variable-name ] <= [ expression | ; 

APREN ВЕНЕ eB“ ee” ТООН ER 3 F j 26 r Z BJ PEF 
非 阻 塞 赋值 的 知识 在 本 书 7. 1 节 中 将 会 有 具体 介绍 。 


4.2.1 D 触发 器 


D 触发 器 有 三 种 类 型 

° 不 带 异 步 复位 端的 D 触发 器 ; 

e 带 异 步 复位 端的 D 触发 器 ; 

ө 带 同步 使 能 端的 D 触发 器 。 

前 两 种 类 型 的 D 触发 器 是 最 基本 的 存储 元 件 ， 并 且 在 任何 器 件 工艺 库 中 都 可 
以 找到 。 第 三 种 D 触发 器 能 通过 简单 的 D 触发 器 构造 而 成 。 本 书包 含 了 相关 代码 ， 
因为 它 是 频繁 使 用 的 存储 元 件 ， 且 能 被 映射 到 Spartan-3 逻辑 单元 的 触发 器 上 。 

不 带 异 步 复位 端的 DD 触发 器 ”触发 器 的 功能 表 如 图 4-1a 所 示 ， 代 码 描述 见 
”示例 4.1。 

示例 4.1 不 带 异 步 复 位 端的 D 触发 器 


module d. ff 
( 
input wire clk ,. 
input wire d, 
output reg q 
) 
// 实体 
always @ ( posedge clk) 
а «-d; 


endmodule 
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在 敏感 列表 中 时 钟 上 升 沿 用 posedge 来 表示 。 关 键 词 posedge ( HI positive 
edge) 表明 了 时 钟 信号 向 电 平 1 变化 ， 表 示 always 块 只 在 时 钟 信号 上 升 沿 才 被 执 
行 。 我 们 注意 到 d 信号 没有 在 敏感 信号 列表 里 出 现 ， 这 就 说 明了 : d 信号 只 能 在 
时 钟 上 升 沿 到 来 时 被 采样 ， 如 果 时 钟 上 升 沿 没有 到 来 ，d 值 的 变化 不 会 引发 任何 
立即 响应 。 

带 异 步 复位 的 D 触发 器 D 触发 器 可 能 带 有 一 个 异步 复位 信号 端 ， 如 图 4- 
lb 所 示 的 功能 表 。 异 步 复 位 信号 能 够 在 任何 时 刻 把 触发 器 清 零 ， 而 不 受 时 钟 信 
号 的 控制 。 异 步 复 位 信号 通常 比 其 他 采样 输入 端的 优先 级 要 高 。 使 用 异步 复位 信 
号 违反 了 同步 设计 方法 学 ， 因 此 应 避免 在 正常 操作 中 使 用 。 异 步 复 位 主要 应 用 是 
实现 系统 初始 化 。 例 如 ， 可 通过 产生 一 个 短 时 复位 脉冲 强制 系统 上 电 后 进入 到 初 
始 状态 。 示 例 4. 2 所 示 代 码 是 带 有 异步 复位 端的 D 触发 器 。 

示例 4.2 带 异 步 复 位 的 触发 器 


module d. ff reset 
( 
input wire clk, reset, 
input wire d, 


output reg q ， 


// 实体 
always? ( posedge clk, posedge reset) 
if( reset) 
q«-1'b0; 
else 
q«-d; 


endmodule 


注意 ， 上 升 沿 的 复位 事件 也 被 包含 在 了 敏感 列表 中 ， 并 且 在 让 语句 中 首先 
检查 了 复位 信号 reset 的 值 。 如 果 复 位 信号 被 置 为 有 效 ， 则 信号 q 会 被 清 零 ， 且 
该 动作 不 会 受到 时 钟 信号 的 制约 。 

带 同步 使 能 的 D 触发 器 D 触发 器 可 能 还 会 带 有 一 个 控制 信号 en， 用 于 使 
能 触发 器 采样 输入 值 。 其 符号 表示 和 功能 表 如 图 4-1e 所 示 。 注 意 ，en 信号 只 会 
在 时 钟 的 上 升 沿 被 检验 ， 因 此 是 同步 的 。 如 果 没 有 被 置 为 有 效 ， 那 么 触发 器 将 保 
持原 值 。 代 码 如 示例 4. 3 所 示 。 
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示例 4.3 带 同步 使 能 的 D 触发 器 代码 风格 


module d ff en_lseg 
( 
input wire clk, reset, 
input wire en, 
input wire d, 


output reg q 


// 实体 
always @ posedge clk, posedge rest) 
if (reset) 
q<= i” b0; 
else if ( en) 
q «-d; 


endmodule 


注意 ， 第 二 个 主语 句 之 后 没有 else 分 支 。 根 据 Verilog 语法 定义 ， 如 果 一 个 
变量 没有 被 赋值 那么 它 将 保持 之 前 的 值 。 如 果 en 70, HA q 保持 它 的 之 前 值 。 
因此 ， 漏 掉 了 else 分 支 恰好 描述 了 触发 器 的 行为 。 

带 使 能 端的 DEF 对 于 保持 一 个 较 高 速 的 子 系统 和 一 个 较 低 速 的 子 系统 之 间 
的 同步 性 ， 是 非常 有 用 的 。 例 如 ， 假 设 一 个 高 速 子 系统 和 一 个 低速 子 系统 的 工作 
频率 分 别 为 50MHz 和 1MHz， 可 以 利用 每 隔 50 个 时 钟 周期 产生 的 一 个 周期 性 使 
能 信号 来 驱动 1MHz 的 低速 子 系统 ， 而 不 是 使 用 分 频 派 生 的 1MHz 时 钟 。 在 剩余 
的 49 个 时 钟 周期 内 这 个 低速 的 子 系统 是 不 工作 的 即 保持 以 前 的 状态 )。 同 样 
的 策略 还 可 用 来 去 除 门 控 时 钟 。 

由 于 使 能 信号 是 同步 的 ， 电 路 可 以 通过 常规 的 D 触发 器 和 简单 的 次 态 逻 辑 
构造 。 示 例 4.4 为 D 触发 器 的 代码 ， 图 4-3 为 它 的 框图 。 





Teset 


图 4-3 带 同步 使 能 的 D 触发 器 
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示例 4.4 带 同 步 使 能 端的 DFT 第 二 种 代码 表示 


module d ff en 2seg 
( 
input wire clk, reset, 
input wire en, 
input wire d, 
output reg q 
Js 
// 信号 的 声明 
reg r_reg, r_next; 
// 实体 
//D FF 
always € ( posedge clk, posedge reset ) 
if ( reset) 
r reg <=1’b0; 
else 
r reg «—r next; 
// REE 
always @ x 
if (en) 
r_next =d; 
else 
r_next =r_reg; 
// Sh EHE 
always @ * 
q-r reg; 


endmodule 


为 了 清晰 起 见 ， 我 们 使 用 后 级 _next 以 及 _reg 来 强调 下 一 次 输入 的 值 以 及 触 
发 器 的 寄存 输出 值 ， 它 们 分 别 是 D 触发 器 的 d 端 信号 以 及 q 端 信号 。 可 以 把 示 
例 4. 3 看 作 是 这 段 复杂 描述 的 速记 。 


4.2.2 寄存 器 
一 个 寄存 器 是 由 同一 时 钟 和 复位 信号 控制 的 D 触发 器 的 集合 ， 与 D 触发 器 
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一 样 ， 寄 存 器 拥有 一 个 可 供 选 择 的 异步 复位 信号 以 及 同步 使 能 信号 。 除 了 相关 输 
人 和 人 /输出 信号 需要 使 用 数组 类 以 外 ， 寄 存 器 的 代码 与 D 触发 器 的 代码 描述 是 一 样 
的 。 如 示例 4.5 中 描述 的 带 异 步 复 位 功能 的 Sbit 寄存 器 。 

示例 4.5 寄存 器 


module reg. reset 
( 
input wire clk, reset, 
input wire [7:0] d, 
output reg [7:0] q 
); 
// 实体 
always @ ( posedge clk, posedge reset ) 
if (reset) 
q«-0; 
else 
q«-d; 
endmodule 


4.2.3 寄存 器 文件 


寄存 器 文件 是 带 有 一 个 输入 端口 和 一 个 或 一 个 以 上 输出 端口 的 寄存 器 集合 ， 
写 地 址 信号 w_addr 指定 了 存储 数据 的 地 址 ,而 读 地 址 信号 r_addr 则 指定 了 要 获 
取 数 据 的 地 址 。 寄 存 右 文件 一 般 用 于 快速 的 、 临 时 性 的 存储 。 示 例 4.6 为 2W x 
B 的 寄存 器 文件 代码 。 两 个 在 设计 中 定义 的 参数 : W 用 于 指定 地 址 的 位 宽 ， 暗 含 
寄存 器 文件 可 存储 2W 个 word, В 用 于 指定 每 一 个 word 的 位 宽 为 B。 
示例 4.6 寄存 器 文件 代码 


module reg_file 
#( 
parameter B 28, // 比特 数 
W =2 // ЖШ EFFEC 
) 
( 


input wire clk, 
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Input wire wr_en, 
input wire [№ -1:0] w_addr, r_addr, 
input wire [B —1:0 ] w data, 
output wire [В —1:0] r data 
); 
// 信号 的 声明 
reg [B -1:0] атау reg [2 +*+ W 21:0]; 
// 实体 
// SE 
always € ( posedge clk ) 

if ( wr. en) 

array reg[ w_addr | <= w data; 

// 读 操 作 
assign r data = array_reg| r_addr | ; 


endmodule 


这 段 代码 包含 了 一 些 新 特性 。 首 先 ， 定义 了 一 个 二 维 数组 ， 即 
reg [B-1:0] array reg [2 ** W -1:0]; 

它 表示 变量 array reg 是 有 [2 * W - 1:0] CRM BWA, 每 个 元 素 中 数据 类 型 为 
reg[ B -1:0]。 第 二 , 可 以 用 一 个 索引 信号 访问 数组 中 的 某 个 元 素 , 例如 array. reg 
[w_addr] 。 人 尽管 描述 很 抽象 , 但 Xilinx 软件 能 够 识别 这 种 语言 结构 , 并 能 获 到 正 
确 的 实现 。array_reg[ …] =… 和 … = array_reg[ …] 语 名 能够 推断 出 相应 的 译 码 和 
多 路 选择 逻辑 。 

一 些 应 用 可 能 需要 在 同一 时 间 获 取 多 个 数据 。 可 以 通过 增加 一 个 额外 的 读 端 
口 实现 : 

r data2 = array. reg [r_addr 2]; 


4.2.4 Xilinx Spartan-3 器 件 的 存储 元 件 


在 Xilinx Spartan-3 屁 件 中 ， 每 个 逻辑 单元 都 含有 带 异 步 复 位 端 和 同步 使 能 端 
的 D fh de, 这些 D 触发 吉 基 本 上 构成 了 图 4-2 所 示 的 寄存 器 。 由 于 逻辑 单元 还 
包含 了 一 个 四 输入 的 LUT， 因 此 如 果 一 个 逻辑 单元 仅 作为 大 容量 存储 器 的 其 中 1 
位 ， 是 非常 浪费 资源 的 。Spartan-3 器 件 还 带 有 分 布 式 КАМ (随机 存储 器 ) 以 及 
固定 的 RAM 模块 ， 一 般 用 于 满足 较 大 的 存储 需求 。 这 些 存储 模块 可 以 配置 为 同 
步 操 作 模 式 ， 其 特点 类 似 于 一 个 寄存 器 文件 的 受 限 制版 本 。 这 些 模块 的 配置 和 推 
断 将 在 第 12 章 中 讨论 。 
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4.3 简单 的 设计 举例 


我 们 将 在 这 一 章节 中 介绍 一 些 简 单 的 、 有 代表 性 的 时 序 电路 构造 方法 。 
4.3.1 移 位 寄存 器 


Free running 移 位 寄存 器 ”Free_running 移 位 寄存 器 在 每 一 个 时 钟 周期 内 将 
寄存 器 中 的 内 容 向 左 或 者 向 右 移 动 一 位 。 没 有 其 他 的 控制 信号 。Nbit 的 free-run- 
ning 移 位 寄存 器 的 代码 如 示例 4.7 所 示 。 

示例 4.7 Free-running 移 位 寄存 器 


module free run shift reg 
#( parameter N 28) 
( 
input wire clk, reset, 
input wire s. in, 
output wire s out 
)s 
ДАР Н] 
reg [N 21:0] r reg; 
wire [N 1:0] r next; 


// 实体 
// BAF At 
always €? ( posedge clk, posedge reset) 
if ( reset ) 
r_reg <=0; 
else 


r reg <=r_next; 
КЕ 
assign r next = |s in, г reg[ N -1:1]] ; 
// ШПНЕ d 
assign s out = г reg[ 0 ] ; 


endmodule 


WAHL T 1bit 的 移 位 器 ， 它 将 r_reg 右 移 一 位 ,并 将 品行 输入 信号 s_ 
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in 插入 到 最 高 位 (MSB), HF 1bit 移 位 器 仅 是 将 输入 和 输出 重新 连接 ， 因 此 不 
需要 真正 的 逻辑 。 它 的 传播 延 时 代表 最 小 可 能 延 时 Tu, XE fuu CHR dE 
件 工艺 所 能 达到 的 最 高 时 钟 速 率 。 
通用 移 位 寄存 器 ”通用 移 位 寄存 器 可 以 装载 并 行 的 数据 ， 向 左 或 向 右 移动 内 
容 ， 或 者 保留 同样 的 状态 。 它 可 以 完成 并 串 转 换 功 能 ( 先 装载 并 行 输入 然后 移 
位 ), 或 者 完成 串 并 转换 功能 ( 先 移 位 然后 得 到 并 行 输出 )。 期 望 的 操作 可 通过 
2bit 控制 信号 (ctrl) 确定 。 代 码 实现 如 示例 4.8 所 示 。 
示例 4.8 通用 移 位 寄存 器 


module univ. shift reg 
#( parameter N 28) 
( 
input wire clk, reset, 
input wire [1:0] ctrl, 
input wire [N 1:0] d, 
output wire [N -1:0] q 
): 
// 信号 的 声 盟 
reg [N -1:0] r_reg, r_next; 
// 实体 
// BAF GH 
always @ ( posedge clk, posedge reset) 
if (reset) 
r_reg <=0; 
else 
r_reg <=r_next; 
КА 
always @ * 
case( ctrl) 
2' b00; r next = r reg; // Jai ME 
2' b01: r next = {г reg[ N -2:0], d[0]] ; // Жж 
2’ 0: г next = |а N-1], r reg[ N-1:1]] ; ZEB 
default; r next = d; // ВН 
endcase 


// Tip ilii dH 
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assign q —r reg; 


endmodule 


次 态 逻 辑 使 用 了 一 个 4 选 1 的 多 路 选择 器 来 选择 期 望 的 寄存 器 新 值 。 注 意 ， 
左 移 或 右 移 操作 中 ，d 的 最 高 位 和 最 低位 CHI dL0] 和 d[N -1]) 被 用 于 串 行 输 
Aa 

在 Xilinx Spartan3 Е, WHCN Л LUT 是 由 16 x1 的 SRAM 来 实 
现 的 ， 同 样 的 SRAM 还 可 以 配置 成 16 个 Ibit SRAM Xilinx 单元 级 联 链 ， 就 像 
16bit 的 移 位 寄存 器 。 这 可 以 用 来 构造 确定 形式 的 移 位 寄存 器 并 且 能 够 使 操作 有 
效 可 行 。 
4.3.2 二 进 制 计数 器 及 其 转换 形式 


Free running 二 进 制 计 数 器 ”Free_running 二 进 制 计数 器 是 通过 不 断 重复 二 
进 制 序列 来 实现 计数 的 。 例 如 ， 一 个 4bit 的 二 进 制 计数 器 从 “0000”，“0001”， 
е 到 “1111” 计 数 并 且 不 断 循 环 。 示 例 4.9 表示 的 是 一 个 Nbit 参数 化 的 二 进 
制 计数 器 。 

示例 4.9 — Free-running ЕС 


module free run bin counter 
#( parameter N 28) 
( 
input wire clk, reset, 
output wire max tick, 
output wire [N 1:0] q 
yy 
// 信号 的 声明 
reg [N -1:0 | r reg; 
wire [N -1:0] г next; 


// Stk 
// BFF Gt 
always @ ( posedge clk, posedge reset) 
if (reset) 
rreg<=0; //|N [1b '0]] 
else 


r reg «-r next; 
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КАЕН 

assign r next = г reg +1; 

// Bi ETE 

assign q =г reg; 

assign max tick = (т reg 222 * «N—1)? I' bl :1' b0; 
// th UI LIH Ge reg == {N ПЫ} } ) 


endmodule 


次 态 逻 辑 是 一 个 对 当前 寄存 器 值 加 1 的 增 量 器 。 由 + 操作 符 定义 可 知 ，r_reg 
计数 到 “1……1” 后 , 加 法 器 重新 由 0 开始 计算 , 该 电路 还 含有 一 个 输出 状态 信 
号 max_tick,， 当 计数 器 加 到 值 最 大 值 “1……1”( 即 计数 到 2"” -1) 时 , max_tick 置 
为 有 效 。 

max_tick 信号 是 一 种 特定 类 型 的 信号 ， 它 只 有 一 个 时 钟 周期 的 有 效 时 间 。 本 
书 中 ， 我 们 称 之 为 “tick”， 并 且 利用 后 缀 名 “_tick” 来 标注 这 种 类 型 的 信号 。 通 
常用 作 与 其 他 时 序 电路 的 接口 的 使 能 信号。 

通用 二 进 制 计数 器 ”通用 二 进 制 计数 器 更 加 便于 使 用 ， 它 能 够 向 上 或 向 下 计 
数 ， 也 可 以 暂停 ， 还 可 以 载 人 某 个 特殊 值 ， 也 可 以 被 同步 清 零 。 表 4-1 总 结 了 通 
用 二 进 制 计 数 器 的 功能 。 注 意 reset 信号 和 syn_clr 信号 之 间 的 区 别 性 ， 前 者 是 异 
步 的 ， 并 且 只 能 用 于 系统 初始 化 ， 而 后 者 在 时 钟 的 上 升 沿 被 采样 ， 能 够 应 用 于 一 
般 的 同步 设计 中 。 计 数 器 代码 如 示例 4. 10 所 示 。 

表 4-1 通用 二 进 制 计 数 器 的 功能 表 








syn_clr load en up q * 操作 
1 == = = 00…00 同步 清 零 
0 1 一 一 d 并 行 加 载 
0 0 1 1 q+1 向 上 计数 
0 0 1 0 q-1 向 下 计数 
0 0 0 = q 暂停 


示例 4. 10 通用 二 进 制 计数 天 


module univ_bin_counter 
#( parameter N 28) 
( 
input wire clk, reset, 


input wire syn. clr, load, en, up, 
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input wire [N - 1:0] d, 
output wire max tick, min tick, 
output wire [N -1:0] q 
J$ 
// 信号 的 声明 
reg [N -1:0] r reg, г next; 
// ЖЖ 
// SEES 
always @ ( posedge clk, posedge reset) 
if( reset) 
rreg<=0; // 
else 
r_reg <=r_next; 
// KANE 
always @ * 
if (syn_clr) 
r_next =0; 
else if ( load) 
r_next =d; 
else if (en & up) 
r_next =r_reg +1; 
else if (en & ~ up) 
r next zr reg - 1; 
else 
r next -r reg; 
Е: 
assign q =г reg; 
assign max tick = (т тев ==2 ** N-1)? I' bl :1' b0; 
assign min tick = (т reg 2-0) ? 1'bl:1" b0; 


endmodule 


always 模块 中 描述 了 次 态 逻 辑 在 功能 表 中 所 述 的 功能 ， 在 always 模块 中 使 用 
了 让 语句 来 优先 处 理 期 望 操作 。 

模 m 计数 器 ” 模 m 计数 器 能 够 从 0 到 mm- 1 不断 循环 计数 ， 示 例 4. 11 是 描 
Ж т 计数 器 的 代码 。 它 有 两 个 参数 : М 指定 了 计数 的 范围 m, N 指定 了 需要 
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的 比特 位 数 ， 应 等 于 [log:M] ， 代 码 见 示例 4. 11 ， 默 认 值 为 模 10 计数 器 。 
示例 4. 11 模 m 计数 器 


module mod_m_counter 


#( 

parameter N =4, // iT tas P I LETC 
M=10 // т 

) 

( 


input wire clk, reset, 
output wire max tick, 
output wire [N-1:0] q 
Js 
// 信号 的 声明 
reg [N -1:0] r reg; 
wire [N -1:0] r next; 
// 实体 
// 寄存 融 
always @ (posedge clk ，posedge reset ) 

if (reset) 

r reg «20; 
else 
r reg <= г next; 

// КЖ 
assign r next = (г тев ==(M-1))? 0:т тев +1; 
ЕЕ. 
assign q =г reg; 
assign max tick = (г тев == (М -1))? I ' bl;1' b0; 

endmodule 


次 态 值 由 条 件 操作 符 构 造 。 如 果 计 数值 到 M -1， 新 值 就 会 清 零 ， 否 则 加 1。 

由 于 NN 的 值 取决 于 M 的 值 ， 所 以 代码 中 另外 定义 的 参数 N 多 少 还 是 有 些 多 
余 。 一 个 更 好 的 办 法 是 定义 一 个 能 根据 M 值 自动 计算 N 值 的 函数 。 该 方法 会 在 
7.4 节 讨 论 。 
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4.4 时 序 电路 的 测试 平台 


如 1.7 节 所 述 ， 测 试 平台 是 一 个 用 于 模拟 物理 实验 平台 的 程序 。 本 节 中 , 我 
们 将 介绍 如 何 去 构造 简单 的 通用 二 进 制 计 数 器 的 测试 平台 ， 还 可 以 当 作 测 试 其 他 
时 序 电 路 的 模板 。 本 书 会 在 7.5 节 中 介绍 如 何 构建 更 加 复杂 的 测试 平台 。 简 单 的 
测试 平台 构造 如 示例 4. 12 所 示 。 
示例 4.12 通用 二 进 制 计数 器 的 测试 平台 


timescale 1 ns/10 ps 
// timescale (y ú HJ 
// 仿真 的 时 间 单 位 是 1ns 
// Tj kis 
module bin. counter. tb( ) ; 
// Fab 
localparam T 220; // АРРА Н 
reg clk, reset; 
reg syn_clr, load, en, up; 
reg [2:0] d; 
wire max lick, min tick ; 
wire [2:0] q; 
// 说 测 单元 例 化 
univ bin counter #(. N(3))uut 
(. elk(clk ) ,. reset( reset) ,. syn. clr( syn. сіт), 
. load( load) ,. en(en) ,. up(up) ,. d(d) , 
. max tick( max tick) ,. min tick( min tick) ,. q( q)) ; 
// IN Bh 
// IEBIUSBI AER 20ns 
always 
begin 
elk =1’ bl; 
#(Т/2); 
clk 21' b0; 
#(T/2); 


end 
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TEBE TT SAE ЛК Ж i А Б 
initial 
begin 
reset =1’ bl; 
#(T/2); 
reset = 1’ b0; 
end 
// 其 他 激励 
initial 
begin 
// ==== 答 人 信号 初始 入 ===== 
syn clrz1' b0; 
load 21' b0; 
en - 1' b0; 
up 21' bl; // 对 up 计数 
d -3' b000; 
@ (negedge reset); // 等 待 复位 解除 
@ (negedge clk); — // SEfg—"f- I] HAY 
// === ШЕНЕ ===== 
load = 1’ bl; 
d -3' b0ll; 
€ ( negedge clk) ; // 等 符 一 个 有 时钟 周 期 
load = 1' b0; 
repeat(2) @ ( negedge clk) ; 
// ==== 测 试 清除 操作 ==== 
syn_clr=1’bl; // JAR fa FARK 
@ ( negedge clk) ; 
syn_clr =1° b0; 
// ==== WA EFR AFRE ==== 
en =1’bl; // 计数 
up =1’ bl; 
repeat( 10) € ( negedge clk) ; 
en 21' b0; // 暂停 
repeat(2) @ ( переве clk); 
en=1’bl; 
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repeat(2) @ ( negedge clk) ; 
// === FPG ==== 
up =1’ b0; 
repeat( 10) @ ( negedge clk) ; 
// ==== 等 等 语句 ==== 
// 等 到 q =2 时 继续 
wait(q ==2); 
@ ( negedge clk) ; 
up =|’ bl ; 
// 等 到 min-tick 变 成 1 有 时 继续 
@ (negedge clk) ; 
wait( min tick ) ; 
€ ( negedge clk) ; 
up 2 1' b0; 
// 22224 === 
#(4* Т); // 等 竺 80ns 
en z1' b0; // ## 
#(4*T); // 47#80ns 
Z =Й === 
// 返回 交互 仿真 模式 
$ stop; 

end 


endmodule 


代码 含有 一 句 用 于 创建 一 个 3bit 计数 器 实例 的 语句 ， 以 及 三 段 用 于 生成 时 钟 
(clock) ， 复 位 (reset) 和 其 他 的 常用 输入 的 语句 。 时 钟 的 生成 可 以 由 一 个 al- 
ways 块 创建 : 
always 
begin 
clk 21' bl; 
#(T/2); 
clk 21" b0; 
#(T/2); 
end 


T 是 一 个 表示 时 钟 周期 的 常量 , 定义 如 下 : 
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localparam T =20; 
TER, iX always 块 没 有 人 敏感 信号 列表 ， 不 断 进 行 自 我 循环 。 时 钟 信 号 被 交替 赋 
予 0 或 者 1， 每 一 个 值 保持 半 个 时 钟 周期 。 
复位 信号 激励 是 通过 initial 块 模拟 产生 的 : 
initial 
begin 
reset 2 1' bl; 
#(T/2); 
reset = 1’ b0; 
end 
initial 块 在 仿真 一 开始 就 立即 执行 。 这 表明 了 复位 信号 初 值 被 置 为 1， 半 个 
时 钟 周期 后 变 为 0。initial 块 表示 的 是 上 电 条 件 : 复位 信号 即刻 对 系统 进行 清理 ， 
进入 初始 状态 。 注 意 ， 上 默认 情况 下 x 值 (不 定 态 ) 被 赋予 一 个 变量 值 ， 而 不 是 
0。 使 用 短 时 复位 脉冲 是 实现 系统 初始 化 的 一 个 不 错 的 机 制 。 
第 二 个 initial 块 生成 用 于 施加 到 其 他 输入 信号 的 激励 。 首 先 对 装载 和 清除 操 
作 进 行 测试 ， 然 后 再 测试 两 个 不 同方 向 的 计数 功能 。 最 后 的 $ stop 函数 用 于 强 
制 仿真 器 停止 仿真 。 对 于 一 个 使 用 正 触发 驱动 触发 器 的 系统 而 言 ， 一 个 输入 信和 号 
必须 在 时 钟 信号 的 上 升 沿 附近 保持 稳定 ， 以 满足 建立 时 间 和 保持 时 间 约 束 。 一 个 
简单 方法 就 是 在 时 钟 信号 由 1 到 0 跳 变 的 时 候 改 变 输入 信号 值 。 可 通过 使 用 下 面 
语句 等 待 这 一 变化 : 
€ ( negedge clk) ; 
negedge clk 事件 指 的 是 时 钟 信 号 跳 变 到 0 的 条 件 〈 即 下 降 沿 ) 。 注 意 ， 每 条 
语句 都 代表 一 个 新 的 下 降 沿 ， 对 应 着 一 个 新 的 时 钟 周期 的 推进 。 在 我 们 的 模板 
中 ， 我 们 通常 使 用 这 种 语句 来 指定 时 序 过 程 。 对 于 多 个 时 钟 周期 ， 可 以 使 用 re- 
peat 语句 ， 如 
repeat (10) @ (negedge clk); // 循环 10 ^I] PRAY; 
一 些 额外 的 时 序 控制 结构 放 在 了 initial 块 的 最 后 。 我 们 可 以 等 待 直 到 某 些 特 
殊 条 件 满足 。 如 “ 当 q 等 于 2” ,代码 如 下 : 
wait (q ==2); 
或 者 等 待 信号 的 跳 变 ， 如 
wait ( min tick) ; 
又 或 是 等 待 某 个 绝对 时 间 ， 如 
#(4*Т); // 等 待 4 KT, 
若 一 个 输入 信号 在 这 些 语句 后 发 生 改 变 ， 则 需要 保证 这 些 输入 信和 号 的 跳 变 不 
能 发 生 在 时 钟 上 升 沿 上 ， 必 要 时 ， 我 们 应 增加 以 下 语句 : 
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@ (negedge clk) ; 
接 下 来 可 以 编译 代码 并 实施 仿真 。 图 4-4 是 部 分 仿真 的 波形 。 


q ж=— уу т үт ж [тук у е ee ES 

l 
min Ар 
max tick, T X ae ee —— 


图 44 测试 平台 波形 图 
45 案例 学 习 


经 过 一 些 简单 的 电路 练习 之 后 ， 这 一 节 会 讨论 一 些 更 加 复杂 的 设计 实例 。 
4. 5.1 LED 分 时 复 用 电路 


S3 板 上 有 4 个 七 段 数码 管 ， 每 一 个 数码 管 包含 7 个 条 段 和 1 个 小 圆 点 ， 为 
了 减少 FPGA 的 IO 引 脚 的 使 用 ，S3 板 使 用 了 分 时 复 用 共享 策略 。 在 此 策略 中 ， 
4 个 七 段 数码 管 拥有 独立 的 使 能 信号 ， 但 是 共享 了 8 个 公共 信和 号， 用 于 亮 灯 数码 
管 的 条 段 。 所 有 信号 低 电 平 有 效 ( 即 ， 当 信号 为 0 时 使 能 ) 。 数 字 “3” 的 显示 
原理 图 如 图 4-5 所 示 。 注 意 ,使 能 信号 (Blan) 为 “1110”。 这 样 的 配置 每 次 只 
能 使 能 一 个 数码 管 的 显示 。 我 可 以 按 图 4-6 中 所 示 的 简化 时 序 图 那样 通过 轮流 使 
能 来 分 时 复 用 这 4 个 数码 管 。 如 果 使 能 信号 的 刷新 速率 足够 快 ， 人 眼 便 无 法 分 辨 
LED 的 开关 间隔 ， 会 在 感官 上 认为 这 4 个 灯 是 同时 亮 的 。 这 一 方法 将 IO 引 脚 数 
从 32 个 降低 到 12 个 〈 即 8 个 LED 数码 管 加 4 个 使 能 信号 ) 。 本 书 将 在 下 一 节 中 
讨论 这 一 电路 的 两 个 形式 。 

使 用 LED 的 分 时 复 用 电路 ”分 时 复 用 电路 的 符号 和 框图 如 图 4-7 所 示 。 它 
使 用 了 4 个 七 段 LED 的 图 像 ，in3 、in2 、inl 和 in0， 并 依照 使 能 信号 把 它们 输出 
到 sseg 上 。 

使 能 信和 号 的 刷新 频率 必须 保持 足够 快 ， 才 能 欺骗 我 们 的 视觉 ， 但 也 不 能 过 
快 ， 以 保证 LED 能 进行 完整 的 开关 操作 。 比 较 合适 的 频率 是 1000Hz 左右 。 在 我 
们 的 设计 中 ， 为 了 达到 这 个 目的 ， 我 们 使 用 一 个 18 位 的 三 进 制 计数 器 。 高 两 位 
被 译 码 产生 使 能 信号 ， 用 于 多 路 开关 的 选择 信号 。 单 个 比特 位 的 刷新 频率 ， 例 如 
第 [0] 位 , Jy (50M/2^) Hz, 约 800Hz。 代 码 见 示例 4. 13。 
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图 4-5 七 段 数码 管 的 分 时 复 用 电路 


图 46 七 段 数码 显示 管 的 分 时 复 用 电路 时 序 图 


disp_mux 





reset 


a) 符号 


clk 


reset 


b) 框图 
图 4-7 分 时 复 用 电路 的 标识 以 及 电路 图 





sseg 


an 
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示例 4.13 使 用 LED 图 样 的 分 时 复 用 电路 


moduledisp_mux 
( 
input wire clk, reset, 
input [7:0] in3, in2, inl, inO, 
output reg [3:0] an, // [ERE A 17244 有 1 [urs BÍ 
output reg [7:0] sseg //LED E 
Js 
// 常量 声明 
// Kil FHL A 800 Hz (50MHz/2 '° ) 
localparam N = 18; 
// 信息 声明 
reg [N-1:0] q reg; 
wire [N 21:0] q. next; 
//М dri rs 
// PAP at 
always @ ( posedge clk, posedge reset) 
if ( reset) 
q reg «20; 
else 
q reg «-q next; 
КЖЕ 
assign q_next = q reg +1; 
// THE I ES РАЈА: EEE 
// 并 且 产 生 做 有 效 使 能 信号 
always @ +* 
case (q тев N -1:N -2]) 
2’ b00: 
begin 
an =4’ b1110; 
звер = 110; 
епа 
2'b0l: 
begin 
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an =4’b1101; 
sseg = inl ; 
end 
2 bl0: 
begin 
an =4”Ь1011; 
sseg =in2; 
end 
default: 
begin 
an =4’ b0111; 
sseg = in3; 
end 
endcase 


endmodule 


我 们 使 用 图 4-8 的 测试 电路 去 验证 LED 分 时 复 用 电路 的 运行 情况 。 测 试 电 
路 使 用 了 8bit 的 寄存 器 存储 LED 的 显示 图 样 ， 这 些 寄 存 器 使 用 相同 的 8bit 开关 
作为 输入 ,但 却 由 各 自 的 使 能 信号 控制 。 当 我 们 按 下 一 个 按钮 ， 相 应 的 寄存 器 被 


使 能 ， 显 示 样式 便 被 加 载 到 这 个 寄存 器 中 。 代 码 如 示例 4. 14 所 示 。 


btn[1] 






disp_mux 


эш гезе! 


btn[3] 


clk 





图 4-8 LED 分 时 复 用 测试 电路 
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示例 4.14 LED 的 分 时 测试 电路 


module disp_mux_test 
( 
input wire clk, 
input wire [3:0] btn, 
input wire [7:0] sw, 
output wire [3:0] an, 
output wire [7:0] sseg 
yy 
// 信号 声明 
reg [7:0] d3 reg, d2 reg, dl reg, dO reg; 
// 例 化 7 BBWS TE ATHY HERIR 
disp. mux disp unit 
(. elk( clk) ,. reset( 1 ' b0) ,. іп0(40 reg) ,. inl (dl reg) , 
. in2( d2. reg) ,. in3(d3 reg) ,. an(an) ,. sseg( sseg) ) ; 
//4 ECU iB РАНЕ SY di 
always @ ( posedge clk) 
begin 
if (btn[3]) 
d3 reg <= sw; 
if (btn[2]) 
d2 reg <= sw; 
if (btn[ 1]) 
dl reg <= sw; 
if (btn[0]) 
40 reg <= sw; 





end 


endmodule 


六 进 制 数据 的 并 行 输入 ”七 段 数码 显示 最 通常 的 应 用 是 用 于 十 六 进 制 数字 
的 显示 。 其 译 码 电路 将 在 第 3.9. 1 节 中 讨论 。 为 了 能 够 在 之 前 的 分 时 复 用 电路 上 
显示 4 个 十 六 进 制 数据 ， 我 们 需要 4 个 译 码 电 路 。 一 个 更 好 的 方法 是 先 多 路 选择 
十 六 进 制 数字 ， 然 后 对 结果 进行 译 码 ， 如 图 4-9 所 示 。 
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hex0 
hexl 
hex2 
hex3 





十 六 进 制 - 


sseg[6:0] 
7 段 译 但 器 


q_reg[17:16] 


clk 


Teset 


图 4-9 十 六 进 制 分 时 复 用 电路 框图 


该 方法 仅 需 一 个 译 码 电路 ， 并 且 可 以 把 4: 1 多 路 选择 器 的 位 宽 从 8 位 减少 到 
5 位 (4 位 用 于 十 六 进 制 数字 ，1 位 用 于 小 数字 ) 。 对 应 代码 如 示例 4. 15 所 示 。 
除了 时 钟 和 复位 ， 输 入 信和 号 还 包括 了 4 个 4 位 的 十 六 进 制 数字 ，hex3 hex2, 
hexl 和 hex0， 以 及 4 个 小 数 点 组 成 的 信和 号 dp_in. o 
示例 4. 15 十 六 进 制 数字 的 LED 分 时 复 用 电路 


module disp_hex_mux 
( 
input wire clk, reset, 
input wire [3:0] hex3, hex2, hexl, hex0, 十 六 进 制 
input wire [3:0] dp in, 114 个 小 数 点 
output reg [3:0] an, // 使 能 , 4 位 当 4 有 1 位 被 置 低 
output reg [7:0] sseg // LED EZ 
); 
// 常量 声明 
// 刷新 频率 约 为 800Hz (50МН2/2  ) 
localparam N =18; 
// 内 部 信号 声明 
reg [N -1:0] q reg; 
wire [N -1:0] q next; 
reg [3:0] hex in; 
reg dp; 
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Z/N fritas 
// SEE dE 
always @ ( posedge clk, posedge гезе!) 
if (reset) 
q reg <=0; 
else 
q reg «-q next; 
// КЖ 
assign q next = q_reg +1; 


// THE BU ES PTDL Fei: 1 ZH Rae 


// 并 产生 做 有效 使 能 入 号 
always @ +* 
case (q тев N-1;N-2]) 
2' b00: 
begin 
an =4’b1110; 
hex in = hex0 ; 
dp = dp in[0]; 
end 
2’ b01; 
begin 
ап =4’b1101; 
hex in = hexl ; 
dp 2 dp in[ 1]; 
end 
2' ыо: 
begin 
ап =4”Ь1011; 
hex_in =hex2; 
dp =dp_in[2]; 
end 
default: 
begin 
an 24" bOlli; 


hex in = hex3; 
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dp =dp_in[3] ; 
end 
endcase 
// 十 六 进 制 数 与 7 段 数码 答 的 对 应 
always @ x 
begin 
case ( hex. in) 
4' hO: sseg[ 6:0] =7’ 10000001; 
4' hl: sseg( 6:0] =7'b1001111; 
4' h2; sseg[ 6:0] 27' b0010010; 
4' h3; sseg[ 6:0] =7’ b0000110; 
4' 4; sseg[ 6:0] 27' b1001100; 
4' h5: sseg[ 6:0] =7’ b0100100; 
4' h6: sseg[ 6:0] 2 7' b0100000; 
4' h7: sseg[ 6:0] =7’ b0001111; 
4' h8: sseg[ 6:0] 2 7' b0000000 ; 
4' h9: sseg[ 6:0] 2 7' b0000100; 
4' ha; sseg[ 6:0] =7’ b0001000; 
4' hb: sseg[ 6:0] =7’ b1100000; 
4' he; sseg[ 6:0] =7’ b0110001 ; 
4' hd: sseg[ 6:0] 27' b1000010; 
4' he; sseg[ 6:0] =7’ b0110000; 
default; sseg[ 6:0] 27' b0111000; //4 'hf 


endcase 








sseg[ 7] = dp; 
end 
endmodule 


为 了 验证 这 个 电路 的 运行 ,我们 使 用 8 个 开关 来 表示 2 个 Abit 的 无 符号 数 ， 
对 两 个 数 相 加 ， 并 在 4 个 七 段 数码 管 上 显示 这 两 个 数 以 及 它们 的 和 。 代 码 如 示例 
4. 16 所 示 。 
示例 4. 16 十 六 进 制 数据 的 分 时 测试 电路 


module hex_mux_test 


( 
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input wire clk, 

input wire [7:0] sw, 

output wire [3:0] an, 

output wire [7:0] sseg 

); 

// 信号 声明 

wire [3:0] a, b; 

wire [7:0] sum; 

// 例 在 7 段 数码 答 

disp_hex_mux disp_unit 
(.clk(clk) ,. reset( 1' b0) , 
. hex3( sum[7:4]) ,. hex2(sum[3:0]) ,. hexl ( b) ,. hex0(a) , 
. dp in(4' b1011) ,. an(an) ,. sseg( sseg) ) ; 

// Jide 

assign a =sw[ 3:0]; 

assign b = sw[7:4]; 

assign sum = 14 b0,a] + |4' bO0,bl ; 

endmodule 


仿真 注意 事项 本 书 中 的 许多 时 序 电 路 是 在 速率 相对 较 低 的 条 件 下 运行 的 ， 
如 LED 分 时 复 用 电路 中 的 使 能 脉冲 。 这 种 情况 可 以 利用 计数 器 产生 一 个 单 周期 
的 使 能 信号 来 实现 。 在 本 电路 中 使 用 了 一 个 18 位 的 计数 器 。 
localparam N =18; 
reg [N-1 :0] q_reg; 
wire [N -1: 0] q next; 


assign q next q reg +1; 

因为 计数 器 的 大 小 ， 这 种 电路 的 仿真 会 耗费 相当 数量 的 计算 时 间 (需要 耗 
费 2 "个 时 钟 周期 完成 一 次 迁 代 ) 。 由 于 我 们 的 关注 点 在 代码 的 复 用 开关 部 分 ， 因 
此 大 部 分 的 仿真 时 间 被 浪费 了 。 所 以 在 仿真 中 使 用 较 小 的 计数 器 效率 会 更 高 一 
些 。 在 构造 这 个 testbench 时 ， 可 以 通过 定义 一 个 常数 来 实现 这 一 点 : 

localparam N =4; 
仅仅 需要 24 个 时 钟 周期 就 能 完成 一 次 迭代 ， 还 可 以 让 我 们 更 好 地 检验 和 观察 关 
键 的 运行 。 

我 们 可 以 将 N 定义 为 一 个 参数 ， 而 不 是 在 仿真 和 综合 之 间 使 用 常量 或 者 修 
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改 代 码 。 在 实例 化 过 程 中 ， 可 以 分 别 为 仿真 和 综合 赋予 不 同 的 值 。 
4.5.2 fX 


这 一 节 我 们 将 讲述 码 表 的 设计 。 码 表 可 显示 精度 为 3 位 十 进 制 数 的 时 间 ， 可 
从 00. Os 计时 到 99. 9s 然后 从 头 开始 。 它 包含 了 一 个 同步 清 零 信 号 clt， 可 以 使 计 
数 返回 到 00.0, 还 含有 1 个 用 来 启动 或 者 暂停 计数 的 使 能 信号 go。 这 个 设计 基 
本 上 算是 个 BCD fj (binary – codede decimal) 计数 器 ， 以 BCD 码 格 式 计 数 。 在 
这 个 格式 中 ,十进制 数 由 一 个 4 位 的 BCD $5 4 s. fl А, 139, 由 
“000100111001” 表 示 ， 下 一 个 数 140 ¿H “0001 0100 0000” 表示 。 

由 于 53 板 有 个 50MHz 的 时 钟 ， 我 们 首先 需要 一 个 模 5，000 000 的 计数 
器 ， 用 于 在 每 隔 0. 1s 产生 一 个 单 周 期 的 使 能 信和 号。 该 使 能 信号 用 于 使 能 这 个 З 
位 数 BCD 计数 器 的 计数 。 

设计 工 我 们 的 第 一 个 ВСЮ 计数 器 的 设计 使 用 了 3 个 计数 为 10 (BIER 10) il 
数 器 的 级 联结 构 ， 分 别 表 示 计 数 0. 1s, 1s 和 10s。 计 数 10 的 计数 器 有 一 个 使 能 
信和 号， 当 它 计数 到 9 的 时 候 会 产生 一 个 单 周 期 有 效 的 使 能 。 我 们 可 以 利用 这 些 信 
号 将 这 3 个 计数 器 “ 钓 ”在 一 起 。 比 如 ， 只 有 当 模 5，000，000 的 计数 器 使 能 有 
SUN, H.O. 1s 和 1s 的 计数 器 计数 到 9 时 ，10s 计数 器 才能 开始 计数 。 代 码 如 示 
例 4.17 所 示 。 

示例 4.17 码 表 的 串联 表示 


module stop_watch_cascade 
( 
input wire clk, 
input wire go, clr, 
output wire [3:0] d2, dl, dO 
15 
// EBH 
localparam DVSR = 5000000; 
reg [22:0] ms reg; 
wire [22:0] ms next; 
reg [3:0] d2 reg, dl reg, dO reg; 
wire [3:0] d2 next, dl next, dO next; 
wire dl en, d2 en, dO en; 
wire ms tick, dO tick, dl tick; 
// 实体 


第 4 章 常规 时 序 电路 . 119 - 





// SY ff Ge 
always @ ( posedge clk) 
begin 
ms reg < = ms, next; 
d2 reg <= d2 next; 
dl reg <= dl next; 
dO reg <= dO. next; 
end 
С, 
//0. 1s ТЇЇ ЛЕЙ : BES 000 ,000 
assign ms. next = (clrl| (ms reg == DVSR && go) ) ? 4 ' bO: 
(go) ? ms reg +1; 
ms reg; 
assign ms tick = (ms reg == DVSR)? 1’ b1;1’ b0; 
//0. 1s tf BaF 
assign d0_en = ms tick; 
assign dO. next = (clr! | ( d0_en && dO reg 2-9) ) ? 4' b0: 
(40 en) ? 40 reg +1: 
dO reg; 
assign dO tick = (dO reg 229) ? 1'bl1;1' b0; 
//ls iT CAS 
assign dl en = ms tick & dO tick ; 
assign dl. next = (clr! | (dl. en && 40 reg 229) ) ? 4' bO: 
(dl en)? dl reg +1; 
dl. reg; 
assign dl tick = (dl, reg 229)? 1’ bl :1' b0; 
//10s 计数 带 
assign d2_en = ms tick & dO tick & dl tick; 
assign d2 next = ( clr] l(d2 en && d2 reg 2-29) ) ? 4' b0: 
(d2 en) ? d2 reg +1; 
d2 reg; 
// ibm d 
assign dO = 40 reg; 
assign dl = dl. reg; 
assign d2 = d2 reg; 
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endmodule 


注意 ， 所 有 的 寄存 器 都 是 由 同一 个 时 钟 信号 来 控制 的 。 本 例 展示 了 如 何 使 用 
单 周 期 的 使 能 信号 来 保持 电路 的 同步 性 。 另 一 种 较为 逊色 的 方法 是 使 用 低 一 级 计 
数 器 的 输出 作为 下 一 阶段 的 时 钟 信 号 。 尽 管 这 种 方法 看 起 来 更 简单 些 ， 但 却 违反 
了 同步 设计 原则 ， 因 此 是 一 个 非常 不 好 的 方法 。 
设计 工 另 外 一 种 描述 3 位 数 BCD 计数 器 的 方法 是 在 嵌 套 的 站 语句 中 描述 整 
个 结构 。 代 码 如 示例 4. 18 所 示 。 
示例 4. 18 在 下 语句 中 描述 码 表 


module stop. watch. if 
( 
input wire clk, 
input wire go, clr, 
output wire [3:0] d2, dl, dO 
m 
// Fa 
localparam DVSR = 5000000; 
reg [22:0] ms reg; 
wire [22:0] ms next; 
reg [3:0] d2 reg, dl reg, dO reg; 
reg [3:0] d2 next, dl next, 10 next; 
wire ms tick ; 
// 实体 
// TY f de 
always @ ( posedge clk) 
begin 
ms reg <= ms next; 
d2 reg <= d2 next; 
dl reg <= dl next; 
dO reg <= dO next; 
end 
// KE SH 
//0. 1s tft dij "^ E ú: BES 000 ,000 
assign ms next = (clr! | ( ms reg == DVSR && go) ) ? 4' b0; 
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(go) ? ms_reg +1; 
ms_reg; 
assign ms tick = (ms reg == DVSR)? 1’ bl:1’ b0; 
//3 位 BCD HARS 
always @ * 
begin 
// BIB ARTE BUR TE 
dO next = dO. reg; 
dl next = 41 reg; 
d2 next = d2 reg; 
if (clr) 
begin 
dO. next =4’ b0; 
dl. next 24' b0; 
d2. next =4’ b0; 
end 
else if ( ms tick) 
if (90 reg! 29) 
dO next = 40 reg 41; 
else // 达到 XX9 
begin 
dO. next 2 4' b0; 
if (dl reg ! 29) 
dl next = dl reg +1; 
else // 达到 X99 
begin 
dl. next 24' b0; 
if(d2 reg ! 29) 
d2 next-d2 reg 41; 
else // 达到 999 
d2 next =4’ b0; 
end 
end 


end 


// flm d 
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assign d0 = dO reg; 

assign dl = dl reg; 

assign d2 = d2 reg; 
endmodule 


验证 电路 ”为 了 验证 码 表 的 运行 ， 我 们 可 以 把 前 面 讲 的 十 六 进 制 LED 分 时 
复 用 电路 合并 ， 用 于 显示 码 表 的 输出 。 代 码 如 示例 4. 19 所 示 。 注 意 ，LED 的 第 
一 个 数字 被 置 为 数字 0，go 和 clr 信号 是 由 S3 板 上 的 两 个 按钮 来 控制 的 。 

示例 4.19 码 表 的 测试 电路 


module stop_watch_test 
( 
input wire clk, 
input wire [1:0] btn, 
output wire [3:0] an, 
output wire [7:0] sseg 
)5 
// 信号 的 声明 
wire [3:0] d2, dl, d0; 
// ИНЕ? Pria H 
disp hex mux disp unit 
(. elk( clk) ,. reset( 1' b0) , 
. hex3 (4° b0) ,. hex2(d2) ,. hexl (41) ,. hex0(d0) , 
. dp in(4' b1101) ,. an(an) ,. sseg(sseg) ) ; 
// МИНЕТ 
stop watch if counter unit 
(. elk( elk) ,. go( bn[1]) ,. clr(btn[0]), 
. d2(d2) ,. dl (dl) ,. d0(d0) ); 
endmodule 


4.5.3 FIFO 缓冲 器 


FIFO (First-In-First-Out) 缓冲 器 是 两 个 子 系统 之 间 的 “弹性 ”存储 器 ， 结 
构 框 图 如 图 4-10 tas. FIFO 有 两 个 控制 信号 : wr 和 了 思 ， 分 别 用 于 写 操 作 和 读 操 
作 。 当 wr 有 效 时 ,输入 数据 被 写 入 缓冲 器 中 。 读 操作 要 稍 难 理解 一 些 。 通 常 来 
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Bú, FIFO 缓冲 器 的 “ 头 部 ”一 直 都 是 可 访问 的 ， 因 此 在 任何 时 候 都 能 对 FIFO 
进行 读 操 作 。 读 信号 rd 扮演 着 “ 移 除 ” 的 角色 。 当 rd 有 效 时 ， 第 一 个 进入 
FIFO 的 数据 〈 即 头 部 ) 被 移 除 ， 第 二 个 数据 马上 变 为 可 访问 项 。 

FIFO 缓 冲 器 


000 


写 入 FIFO 中 的 数据 从 FIFO 中 读 出 的 数据 
图 4-10 FIFO 缓冲 器 结构 图 


FIFO 缓冲 器 是 许多 应 用 中 的 关键 器 件 ， 经 过 优化 的 实现 可 能 会 异常 复杂 。 
在 这 一 小 节 中 ， 我 们 介绍 一 个 简单 、 实 用 的 基于 循环 队列 的 设计 。 更 加 高 效 ， 针 
对 特定 融 件 的 实现 可 以 查阅 Xilinx 文档 。 

基于 循环 队列 的 实现 ”构造 FIFO 缓冲 器 的 其 中 一 种 方法 是 在 寄存 器 组 上 添 
加 一 个 控制 电路 。 寄 存 器 文件 中 寄存 器 被 排列 成 循环 队列 ， 并 使 用 两 个 指针 访 
问 。 写 指针 指向 队列 的 头 部 ， 而 读 指 针 指向 队列 的 尾部 ， 指 针 根 据 每 次 读 或 者 写 
操作 向 前 推进 。8 个 word 的 循环 队列 的 操作 如 图 4-11 所 示 。 

FIFO 缓冲 器 通常 包含 两 个 状态 信号 ，fual 和 empty， 分 别 表 示 FIFO 98 (BB 
不 能 被 写 人 ) 和 空 〈 即 不 能 被 读 出 ) 。 当 读 指针 等 于 写 指针 时 ， 这 两 个 状态 的 其 
中 一 种 就 会 发 生 ， 如 图 4-11a、f 以 及 i 所 示 。 控 制 器 最 难 设 计 的 地 方 是 获取 一 个 
区 分 这 两 种 状态 的 机 制 。 一 种 机 制 是 使 用 两 个 触发 噩 去 跟踪 empty 和 full 状态 ， 
在 系统 初始 化 时 ， 这 两 个 触发 器 分 别 置 位 为 1 和 0， 然 后 在 每 个 时 钟 周期 根据 wr 
信号 和 rd 信号 值 来 修改 这 两 个 触发 器 的 值 。 代 码 如 示例 4. 20 所 示 。 

示例 4.20 FIFO 缓冲 器 


module fifo 
#( 
parameter B 28, // 每 个 字 的 比 符 数 
W =4 // 地 址 比特 数 
) 
( 
input wire clk, reset, 
input wire rd, wr, 
input wire [B -1:0] w_data, 


output wire empty , full, 
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output wire [В - 1:0] г data 
bs 
// 信息 声明 
reg [В -1:0] array_reg [2**W-1:0]; // FFAA 
reg |W -1:0] w ptr reg, м ptr next, w ptr succ; 
reg |W - 1:0] r ptr reg, г ptr next, r ptr succ; 
reg full reg, empty reg, full next, empty. next; 
wire wr en; 
// 实体 
// 寄存 静 写 操作 
always @ (posedge clk) 
if (wr_en) 
array reg[ w_ptr_reg | <= w_data; 
// BFF EERIE 
assign r data = array_reg[ r_ptr_reg | ; 
// FUE 2E FIFO 未 满 时 , 写 使 能 有 效 
assign wr_en =wr & ~full_reg; 
// FIFO #229 
// 读 写 背包 寄存 融 
always @ ( posedge clk, posedge reset) 
if ( reset) 
begin 
w. ptr reg <=0; 
r ptr reg «20; 
full reg <= 1' b0; 
empty reg <=1’ bl; 
end 
else 
begin 
w. ptr reg <= w ptr next; 
r ptr reg «-r ptr next; 
full reg «- full. next; 
empty reg <= empty next; 
end 


/ EGE NK A 
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always @ * 

begin 
// WBS TEA 
w. ptr succ = w ptr reg +1; 
r ptr succ —r ptr reg +1; 
// BRIM: (REE BIB EL 
w ptr next = w ptr reg; 
r ptr next = г ptr reg; 
full next = full reg; 
empty next = empty reg; 
case ( | wr, ті!) 


//2 'b00 :无 操作 
2' b01:// i£ 
if ( ~ empty reg) // RÆ 
begin 
r ptr next —r ptr succ; 


full next 2 1 ' b0; 
if (r ptr suce == w ptr reg) 
empty next =1 bl; 
end 
2' b10:// 57 
if ( ~ full reg) // KÙ 
begin 
w ptr next —w ptr succ; 
empty. next = 1' b0; 
if (w. ptr succ == r_ptr_reg) 
full. next 2 1 ' bl; 


end 
2'bll: // FANE 
begin 


w. ptr next = w. ptr succ; 
r ptr next 2r ptr succ; 
end 
endcase 


end 
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ЕЕЕ 
assign full = full reg; 
assign empty — empty reg; 





endmodule 
PS a" е 读 指针 
二 EY GOA 
a) 最 初 状态 ( 空 ) b) 经 过 一 段 时 间 c) a 
写 指针 
读 指针 读 指针 
Су 
„юй 
d) 读 出 1 个 数 后 e) 再 写 入 4 个 数 £) 再 写 入 1 个 数 ( 满 ) 
dit 读 指针 
G © CN QC š 
读 指针 
g) 读 出 2 个 数 h) 再 读 出 5 个 数 i) 再 读 出 1 个 数 ( 空 ) 


图 4-11 基于 循环 队列 的 FIFO 缓冲 器 
这 段 代码 分 为 寄存 器 组 和 FIFO 控制 器 两 个 部 分 。 控 制 器 包含 了 两 个 指针 以 
及 两 个 状态 触发 器 。 次 态 逻 辑 检测 wr ЖП та 信号 并 采取 相应 的 动作 。 例 如 ， 分 析 
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下 case 语句 中 “10” 的 情况 ， 它 表明 只 发 生 了 写 操 作 。 首 先 检查 状态 触发 器 是 
否 处 于 非 满 状态 ， 如 条 件 满足 ， 便 将 写 指针 向 前 推进 一 个 地 址 ， 并 清 零 空 状态 触 
发 器 。 如 果 再 存储 一 个 数据 可 能 会 让 FIFO 处 于 满 状 态 ， 则 这 一 情况 会 发 生 在 新 
的 写 指 针 “ 追 上 ” 读 指 针 时 ， 用 w_ptr_suce 22r ptr reg 表达 式 表 示 。 

验证 电路 ”验证 电路 用 于 检查 2° x3 FIFO 缓冲 器 的 运行 。 我 们 使 用 3 个 拨 
动 开 关 去 生成 输入 数据 并 使 用 两 个 按钮 产生 wr 信号 以 及 rd 信号 。3bit 的 readout 
和 full. empty 状态 信号 用 5 个 分 立 的 LED 灯 显 示 。 由 于 机 械 接 触 具 有 抖动 干扰 ， 
需要 用 一 个 去 拌 电 路 产生 一 个 干净 的 单 时 钟 周期 信号 。 去 拌 模 块 debounce 已 经 
在 6.2.1 节 中 做 了 详细 介绍 ， 但 是 现在 我 们 可 以 将 其 看 作 是 一 个 已 经 设计 好 的 模 
块 。 原 始 的 按钮 输入 信和 号 为 bn[0] 和 btn[1], 去 抖 后 的 信和 号 为 db_btn[0] 和 db_ 
btn[1] 。 代 码 如 示例 4. 21 所 示 。 

示例 4.21 FIFO 缓冲 器 的 验证 电路 


module fifo_test 
( 
input wire clk, reset, 
input wire [ 1:0] btn, 
input wire [2:0] sw, 
output wire [7:0] led 
); 
// 信号 声明 
wire [1:0] db btn; 
// btn [0 ЈА: 
debounce btn. db. unitO 
(. elk( clk) ,. reset( reset) ,. sw( btn[ 0]) , 
. db level( ) ,. db. tick( db btn[0])) ; 
// bin [1 ] I] Z- BL ff 
debounce btn. db unitl 
(. elk( elk) ,. reset( reset) ,. sw( btn[ 1]) , 
. db level( ) ,. db tick(db btn[1])); 
// fJfk22 x3 的 FTFO 
fifo #(. B(3), . W(2) ) fifo unit 
(. elk( clk) ,. reset( reset) , 
. rd( db btn[0]) ,. wr(db btn[1]),. w_data(sw) , 
. r. data( led[ 2:0] ) ,. full(led[7]) ,. empty(led[6])); 
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// 禁用 未 使 用 的 LED4J 
assign led[ 5:3] =3’ b000; 


endmodule 


4.6 文献 备注 
本 章 的 参考 文献 信息 与 第 3 章 大 致 相 同 。 


4.7 实验 


4.7.1 可 编程 的 方 波 生成 器 


可 编程 的 方 波 生成 器 是 一 个 可 以 按 一 定 的 间隔 产生 变量 开 GESR 0) 和 关 
(如 逻辑 0) 的 方 波 的 电路 。 间 隔 的 持续 时 间 由 两 个 4bit 无 符号 整 型 变量 m 和 nm 
来 控制 的 。 开 和 关 的 间隔 分 别 保持 m* 100 ns Fil п * 100 ns (S3 板 的 晶振 周期 为 
20ns) 。 设 计 一 个 可 编程 的 方 波 生 成 器 电路 。 这 个 电路 应 该 是 完全 同步 的 。 需 要 
一 个 逻辑 分 析 器 或 示波器 来 验证 其 工作 。 


4.7.2 PWM 和 LED 调节 器 


方 波 信 号 的 占 空 比 被 定义 为 开间 隔 ( 即 逻辑 1) 在 周期 中 所 占 的 比例 。 
PWM (Pulse Width Modulation ， 脉 宽 调 制 ) 电路 可 以 生成 不 同 占 空 比 的 输出 。 对 
于 一 个 4bit 分 辩 率 的 PWM，4bit 的 控制 信号 w 用 于 指定 占 空 比 。 信 和 号 w 被 当做 
无 符号 整 型 数 ， 占 空 比 为 w/16。 

1) 设计 一 个 4bit 分 辩 率 的 PWM 电路 ， 利 用 逻辑 分 析 器 或 者 示波器 验证 其 
运行 情况 ; 

2) 修改 LED 分 时 复 用 电路 ， 为 一 个 信号 添加 PWM 电路 ，PWM 电路 指定 了 
LED 数码 管 显示 的 时 间 百 分 比 ， 可 通过 改变 占 空 比 来 控制 感知 的 亮度 ， 通 过 在 
逻辑 分 析 器 或 示波器 中 观察 1 位 ап 信和 号 来 验证 这 个 电路 ; 

3) 使 用 新 的 设计 来 代替 示例 4.19 中 的 LED 分 时 复 用 电路 ， 并 使 用 8 位 开 
关 的 低 4 位 来 控制 占 空 比 ， 验 证 电路 的 正确 性 ， 可 能 需要 在 一 个 黑暗 的 环境 中 观 
察 调 节 的 效果 。 


4.7.3 旋转 的 方形 图 案 电 路 
在 七 段 数码 显示 管 中 ， 我 们 可 以 使 能 a、b、f、g 段 或 者 c<、d、e、g 段 来 构 
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造 一 个 方形 图 案 。 我 们 要 设计 这 样 一 个 电路 : 让 方形 图 案 在 4 位 七 段 数码 管 中 转 
动 。 顺 时 针 循 环 的 图 案 如 图 4-12 所 示 。 电 路 应 该 有 输入 信号 en， 用 于 使 能 或 者 
暂停 转动 ， 以 及 一 个 能 指定 方向 〈 顺 时 针 方向 或 者 逆 时 针 方 向 ) 的 输入 信号 ew, 

设计 这 个 电路 并 在 开发 板 上 验证 。 确 保 循环 的 频率 应 足够 慢 以 便 视觉 上 能 够 



































OO CO C) LN NI.) 
OID CCH OL шишиши 


图 4-12 实验 4.7.3 的 显示 样式 











4.7.4 心跳 电路 


我 们 想 要 为 开发 板 创 建 一 个 “心跳 ”"。 如 图 4-13 所 示 ， 这 个 电路 只 需要 以 
72Hz 的 频率 将 简单 的 图 形 在 4 个 七 段 数码 管 上 重复 显示 。 在 开发 板 上 设计 这 个 
电路 并 验证 其 运行 情况 。 

0010 (ГГА ү ЇГЇЇ | 


{ЗГ БЕЛП  DCOCUI 


图 4-13 实验 4.7.4 的 显示 样式 
4.7.5 可 轮换 的 LED 标语 电路 
原 板 上 有 4 个 七 段 数码 显示 管 ， 因 此 在 同一 时 刻 只 能 显示 4 个 不 同 的 符号 。 


如 果 数 据 是 可 以 不 断 轮换 和 移动 的 ， 那 么 就 可 以 显示 更 多 的 信息 。 人 例如， 假设 有 
10 位 数 (Ер “0123456789” ) ， 数 码 显 示 管 可 以 按 “0123”，“1234”，“2345”， 


Sina “6789”,“7890”，……“0123” 这 样 的 方式 显示 。 电 路 应 有 一 个 输入 信和 号 
en， 用 于 使 能 或 暂停 循环 ， 以 及 一 个 控制 轮换 方向 (向 左轮 换 或 者 向 右 轮 换 ) 
的 输入 信号 dir。 


设计 这 个 电路 并 在 开发 板 上 验证 。 确 保 轮换 的 速率 应 足够 慢 以 便 视觉 上 能 够 
4.7.6 增强 的 码 表 

对 码 表 进 行 如 下 扩展 : 

1) 增加 额外 的 up 信号 来 控制 计数 的 方向 ， 当 信号 up 有 效 时 向 上 计数 ， 否 
则 向 下 计数 ; 
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2) 增加 分 钟 数 的 显示 ， 在 LED 数码 管 的 显示 格式 应 如 M. SS.D， 其 中 D 表 
示 的 是 0. 1s， 其 范围 为 0 ~9，SS 表示 的 是 秒 ， 其 范围 是 00 ~ 59, М 表示 的 是 分 
钟 ， 其 范围 是 0 ~9。 

设计 这 个 新 的 码 表 并 使 用 测试 电路 验证 其 运行 情况 。 


4.7.7 X 


栈 是 一 个 后 进 先 出 的 缓冲 器 ， 即 后 存储 的 数据 先 被 取出 来 。 通 过 “push” 
操作 来 存储 数据 至 栈 中 ， 通 过 “pop” 操 作 去 获得 数据 ， 栈 的 L/O 引 脚 和 FIFO 
缓冲 器 的 类 似 ， 但 一 般 我 们 使 用 “push” 和 “pop” 信 和 号 来 取代 FIFO 中 的 wr 和 
rd 信号 。 使 用 寄存 器 组 设计 一 个 栈 并 使 用 测试 电路 来 验证 运行 情况 ， 可 以 参考 
示例 4.21。 


5.1 引言 


有 限 状态 机 (FSM) 用 来 对 具有 有 限 个 内 部 转换 状态 的 系统 进行 建 模 。 这 些 
状态 的 转换 依赖 于 当前 的 状态 和 外 部 输入 。 与 常规 的 时 序 电 路 不 同 ， 有 限 状 态 机 
的 状态 转换 并 不 是 简单 的 重复 模式 。 有 限 状 态 机 的 次 态 通常 是 不 固定 的 ， 这 一 点 
与 常规 时 序 电路 不 同 ， 常 规 时 序 电路 的 次 态 大 多 为 结构 化 的 元 件 ， 如 加 法 器 或 移 
MARE o 

本 章 对 状态 机 的 基本 特点 和 表示 方法 进行 了 概述 ， 并 论述 HDL 代码 实现 方 
式 。 在 实际 应 用 中 ， 状 态 机 主要 用 作 大 型 数字 系统 的 一 个 控制 器 ， 检 查 外 部 指令 
和 状态 ， 并 激活 一 些 控制 信号 ， 以 控制 由 常规 时 序 元 件 组 成 的 数据 路 径 的 运行 。 
这 类 状态 机 通常 又 称 之 为 FSMD (人 带 有 数据 路 径 的 有 限 状态 机 ) ， 会 在 第 6 章 进 
行 讨 论 。 


5.1.1 Mealy 输出 和 Moore 输出 


状态 机 的 基本 框图 与 常规 时 序 电路 相同 ， 如 图 5-1 所 示 ， 一 般 包 含 状 态 寄存 
器 、 次 态 逻 辑 、 输 出 逻辑 。 如 果 一 个 有 限 状态 机 的 输出 只 与 其 当前 状态 相关 ， 则 
该 状态 机 被 称 为 Moore 状态 机 ; 如 果 一 个 有 限 状 态 的 输出 既 与 当前 状态 有 关 又 与 
外 部 输入 有 关 ， 则 该 状态 机 被 称 为 Mealy 状态 机 。 一 个 复杂 的 状态 机 中 可 以 同时 
包含 Mealy 输出 和 Moore 输出 。Mealy 输出 和 Moore 输出 相似 ， 但 不 完全 一 致 。 
理解 它们 细微 差别 的 关键 在 控制 器 的 设计 上 。 第 5.3. 1 节 的 例子 说 明了 这 两 种 类 
型 输出 的 行为 和 结构 特点 。 
























Mealy 

state re 

输入 State_next ы 
NUR Moore 
clk m 输出 


图 5-1 同步 状态 机 框图 
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5.1.2. 有 限 状态 机 表示 方法 


状态 机 通常 由 一 个 抽象 的 状态 图 或 ASM 图 (算法 状态 机 图 ) 详细 说 明 ， 对 
状态 机 的 输入 、 输 出 、 状 态 和 转移 进行 图 形 化 表示 。 两 种 表示 方法 提供 了 同样 的 
信息 。 状 态 图 表示 方法 比较 适合 简单 的 应 用 ， 而 ASM 图 表示 法 更 像 是 一 个 流程 
图 ， 更 适合 描述 具有 复杂 转移 条 件 和 行为 的 应 用 。 

状态 图 ”状态 图 由 若干 节点 组 成 ， 节 点 表示 状态 (由 圆圈 表示 ) ， 并 通过 条 
件 转 移 弧 线 进行 标注 。 一 个 单 节点 和 条 件 转移 弧 线 如 图 5-2a AS. BARAA 
由 相关 输入 信号 和 与 之 相关 的 转移 弧 线 表示 ， 表 示 特 定 的 条 件 。 当 条 件 表达 式 计 


mo:Moore 输 出 
me:Mealy 输 出 | 






逻辑 表达 式 /me= 有 效 值 逻辑 表达 式 /me= 有 效 值 


mo:Moore 输 出 
me:Mealy 输 出 


F 二 一 一 一 一 一 一 一 一 一 一 熏 一 上 二 一 一 一 一 一 一 一 一 一 一 二 一 一 二 


输出 到 ASM 模 块 答 出 到 ASM 模 块 
b) ASM 模 块 


52 ”状态 符号 
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算 值 为 真 时 ， 转 移 生 效 。 

由 于 Moore 输出 值 只 与 当前 状态 相关 ， 因 此 输出 值 放 在 圆圈 内 。 而 Mealy 输 
出 值 与 当前 状态 和 外 部 输入 都 相关 ， 因 此 与 转移 弧 线 相关 。 为 了 减少 状态 图 的 腕 
肿 ， 只 有 和 置 位 的 输出 值 被 列 出 。 其 他 (未 置 位 ) 的 输出 值 取 默 认 值 。 

图 5-3a 所 示 状 态 图 描述 的 状态 机 有 3 个 状态 ，2 个 外 部 输入 信号 (aM b), 
一 个 Moore 输出 信号 (yl) 和 一 个 Mealy 输出 信号 (y0)。 当 状态 机 处 于 50 状态 
或 sl RAY, yl 置 为 有 效 。 当 FSM 处 于 50 状态 ， 且 a、b 信号 的 值 为 “11” 
时 ，y0 置 为 有 效 。 














广 一 一 一 一 一 一 一 一 一 一 一 一 一 一 才 一 一 一 一 一 一 一 一 一 


























a) 状态 图 b) ASM 图 


图 5-3 ”状态 机 示例 


ASM ASM 图 是 由 ASM 块 组 成 的 网 络 。 每 一 个 ASM 模块 包含 1 个 状态 
框 和 一 个 可 选 的 表决 框 及 条 件 输出 框 。 图 5-2b 为 一 个 典型 的 ASM 块 。 

状态 框 用 来 表示 状态 机 的 一 个 状态 ， 同 时 在 状态 框 内 明确 了 Moore 输出 值 。 
状态 框 只 有 一 个 输出 路 径 。 表 决 框 测 试 输入 条 件 并 决定 走 哪 条 路 径 。 表 决 框 有 两 
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个 出 口 ， 标 记 为 T 和 了 ， 分 别 表 示 条 件 为 真 和 条 件 为 假 。 条 件 限定 框 列 出 了 置 位 
的 Mealy 输出 值 ， 并 通常 放置 在 表决 框 的 后 面 。 它 表明 只 有 当 表 决 框 中 相应 的 条 
件 满足 时 ， 列 出 的 输出 信号 才 将 被 激活 。 

状态 图 可 以 很 容易 转换 为 ASM 图 ， 反 之 亦 然 。 图 5-3b 给 出 了 由 状态 图 转换 
后 的 ASM 图 。 


5.2 状态 机 编码 设计 


状态 机 编码 设计 与 常规 时 序 电路 编码 设计 相似 。 首 先 分 离 状态 寄存 器 ， 然 后 
使 用 组 合 逻 辑 对 次 态 逻 辑 和 输出 逻辑 进行 编码 。 主 要 的 差异 体现 在 次 态 罗 辑 。 对 
于 有 限 状态 机 而 言 ， 其 次 态 逻 辑 的 代码 需要 按照 状态 图 或 ASM 图 中 的 流程 进行 
设计 

出 于 清晰 和 灵活 性 的 考虑 ， 我 们 使 用 符号 常量 表示 状态 机 的 状态 。 例 如 ， 图 
5-3 中 的 状态 可 以 采用 下 面 的 方式 进行 定义 : 

localparam [1:0] s0 22' b00, 

sl =2'b01, 
82 =2’bl0; 

综合 时 ， 软 件 通常 能 识别 状态 机 结构 ， 并 将 这 些 符号 常量 映射 为 不 同 的 二 进 
制 表示 法 (例如 ，one-hot 编码 ) ， 这 一 过 程 称 之 为 状态 分 配 。 

完整 的 状态 机 编码 如 示例 5. 1 тл, BERST, KAZH, Moore 输 
出 逻辑 和 Mealy 输出 逻辑 。 

示例 5.1 FSM 举例 


module fsm eg mult seg 

( 

input wire clk, reset, 

input wire a, b, 

output wire yO, yl 

); 

// 状态 奈 志 声明 

localparam [1:0] s0 22'b00, 
sl =2’b01, 
s2 =2’bl0; 

// 信号 声明 

reg [1:0] state reg, state next; 
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// 状态 寄存 吏 
always @ (posedge clk, posedge reset) 
if ( reset) 
state reg <= sÜ; 
else 
state reg <= state next; 
// KATE 
always @ * 
case (state reg) 
50: if (a) 
if (b) 
state next = s2; 
else 
state next = $1 ; 
else 
state next = s0; 
sl; if (a) 
state next = s0; 
else 
state next = sl; 
52; state next = s0; 
default: state next = s0; 
endcase 
// BEACH IH EE 
assign yl = (state reg == 50) | | (state reg ==s1) ; 
// KFIR 298 
assign yO = (state reg ==s0) & a & b; 


endmodule 


上 述 代码 的 关键 部 分 是 次 态 逻 辑 。 它 使 用 了 case 语句 , 将 state. reg 信号 作为 
选择 表达 式 。 次 态 (BI state. next 信号 ) 是 由 当前 状态 〈 即 state. reg) 和 外 部 输入 
决定 的 。 每 个 状态 的 代码 主要 参考 图 5-3b 所 示 的 每 个 ASM 块 内 的 活动 。 

状态 机 编码 的 另外 一 种 方式 是 将 次 态 逻 辑 和 输出 逻辑 合并 到 一 个 组 合 逻辑 块 
中 ， 如 示例 5.2 所 示 。 
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示例 5. 2 使 用 组 合 逻 辑 合并 的 状态 机 示例 


module fsm_eg 2_seg 
( 
input wire clk, reset, 
input wire a, b, 
output reg yO, yl 
ye, 
// 状态 标志 声明 
localparam [1:0] s0 -2' b00, 
sl 22"b01, 
s2 =2’bl0; 
// 信号 声明 
reg [1:0] state reg, state next; 
/7 状态 等 存疑 
always @ ( posedge clk, posedge reset) 
if (reset) 
state reg < = s0; 
else 
state reg < = state next; 
// FRERE ЛИНЕ 
always @ * 
begin 
state. next = state reg; // BRIA FTIRA: ЖНА] 
yl =1’b0; // BRU indi: 0 
yO z1'b0; // BRA Hi: 0 
case (state reg) 
s0; begin 
yl 21! bl; 
if (a) 
if (b) 
begin 
state next = s2; 
yO =1 bl; 


end 
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else 
state next =sl; 
end 
sl: begin 
yl =1 bl; 
if (a) 
state. next = s0; 
end 
S2: state next = s0; 
default; state next = 80; 
endcase 
end 


endmodule 


注意 ， 状 态 机 的 默认 输出 值 列 在 了 代码 的 开始 部 分 。 

次 态 逻辑 和 输出 逻辑 的 代码 要 实现 与 ASM 图 的 流程 一 致 。 一 旦 得 到 了 详细 
的 状态 图 或 ASM 图 ， 状 态 机 转换 为 HDL 代码 几乎 是 一 个 机 械 的 过 程 。 示 例 5. 1 
和 5.2 可 以 作为 这 一 用 途 的 模板 。 

Xilinx ISE 工具 内 包含 了 一 个 叫 StateCAD 的 程序 ， 人 允许 用 户 以 图 形 的 方式 画 
一 个 Xilinx 状态 图 。StateCAD 会 将 状态 图 转换 为 精确 的 HDL 代码 。 可 以 使 用 一 
个 简单 的 例子 确定 StateCAD 生成 的 代码 是 否 是 满足 要 求 ， 尤 其 对 如 输出 信号 。 


5.3 设计 举例 


5.3.1 上 升 沿 检测 器 


上 升 沿 检 测 器 在 输入 信号 由 0 变 为 1 时 ， 会 产生 一 个 时 钟 周期 的 指示 信和 号 
(tick) ， 常 用 来 指示 时 序 变化 较 慢 的 输入 信和 号 的 开始 时 刻 。 下 面 分 别 通过 Moore 
状态 机 和 Mealy 状态 机 实现 上 升 沿 检查 器 的 电路 功能 ， 并 比较 两 者 的 不 同 。 

基于 Moore 的 设计 基于 Moore 的 边沿 检测 器 的 状态 图 和 ASM 图 如 图 54 所 
示 。0 状态 和 1 状态 分 别 用 于 指示 输入 信和 号 值 为 0 和 1 的 情况 。 在 0 状态 时 ， 当 
输入 信号 变 为 1 时 ， 表 示 检 测 到 上 升 党， 状态 机 跳 转 到 edge 状态 。 在 edge 状态 
中 对 输出 信号 tick 置 为 有 效 。 典 型 的 时 序 图 见 图 5-5 的 中 间 部 分 。 代 码 如 示例 
5.3 TAN. 
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a) 状态 图 b) ASM 图 
图 54 ”基于 Moore 状态 机 的 边沿 检测 器 
ty b 


Г = 
Mealy | 
状态 机 4 | Г | 
tick | | 
| l 


l 图 5.5 ”两 个 边沿 检测 器 的 时 序 图 





第 5 章 有 限 状 态 机 139. 





示例 5.3 基于 Moore 的 上 升 沿 检测 器 


module edge_detect_moore 
( 
input wire clk, reset, 
input wire level, 
output reg tick 
)3 
// 状态 标志 声明 
localparam [1:0] 
zero =2' b00, 
edg =2’b01, 
one =2 b10; 
// 信号 声明 
reg [1:0] state reg, state next; 
// AS SF Ar 
always @ ( posedge clk, posedge reset) 
if (reset) 
state reg < = zero; 
else 


state reg <= state next; 


// FARE EH 


always @ ж 
begin 
state_next =state_reg; // ЖАК: 相同 
tick =1’ b0; // BRU idi 0 
case (state reg) 
Zero: 
if (level) 
state next — edg; 
edg: 
begin 
tick =1’ bl; 
if (level) 


state_next = one; 
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else 
state next = zero; 


end 


if ( ~ level) 
state next — zero; 
default: state next — zero; 
endcase 


end 


endmodule 


基于 Mealy 的 设计 基于 Mealy 的 边沿 检测 器 的 状态 图 和 ASM 图 如 图 5-6 所 
示 。0 状态 和 1 状态 意思 相似 。 当 状态 机 处 于 0 状态 并 且 输 入 信号 变 为 1 时 ， 输 出 
信和 号 立即 置 为 有 效 。 状 态 机 在 时 钟 信号 的 上 升 沿 跳 转 到 1 状态 。 在 1 状态 时 ， 输 出 
信号 置 为 无 效 。 典 型 的 时 序 图 如 图 5-5 的 底部 。 注 意 ， 由 于 传输 延 时 ， 输 出 信号 仍 
然 在 下 个 时 钟 信号 (u) 的 上 升 沿 置 位 。 示 例 5. 4 给 出 了 状态 机 的 代码 实现 。 








a) 状态 图 b) ASMA 


95-6 基于 Mealy 的 沿 检测 器 
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示例 5.4 基于 Mealy 的 上 升 沿 检测 器 


module edge_detect_mealy 
( 
input wire clk, reset, 
input wire level, 
output reg tick 
ju 
// 状态 符号 声明 
localparam zero = 1' b0, 
one =1’ bl; 
// 信号 声明 
reg state_reg, state_next; 
// ARES EFF aS 
always € ( posedge clk, posedge reset) 
if (reset) 
state reg <= zero; 
else 


state reg <= state next; 


// PARARE B RI LI EHE 
always @ +* 
begin 
state next = state reg; // BURA: lg 
tick = 1 b0; // BRU idi: 0 
case (state reg) 
Zero: 
if (level) 
begin 
tick 2 1' Ы; 
state next = one; 
end 
one ; 
if ( ~ level) 


state next — zero; 


default; state next — zero: 
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endcase 
end 


endmodule 


直接 实现 ”由 于 上 升 沿 检测 器 实现 十 分 简单 ， 因 此 可 以 不 使 用 状态 机 实现 。 
出 于 比较 目的 ， 本 书包 含 其 实现 部 分 。 如 图 5-7 电路 图 所 示 ， 直 接 实现 的 上 升 沿 
检测 器 可 以 解释 为 只 有 当前 的 输入 为 1 并 且 存 储 在 寄存 器 中 之 前 的 输入 为 0 时 输 
出 被 置 为 有 效 。 相 应 代码 实现 如 示例 5. 5 所 示 。 


level | 
clk 5 delay_reg 


5-7 Wee ERU! OK 
示例 5.5 治 检测 器 的 门 级 实现 

















module edge_detect_gate 
( 
input wire clk, reset, 
input wire level, 
output wire tick 
); 
// 信号 声明 
reg delay_reg; 
// ЖЕШ} SY TE de 
always € ( posedge clk, posedge reset) 
if ( reset) 
delay reg <=1 b0; 
else 
delay. reg <= level; 
// fiim H 
assign tick = ~ delay reg & level; 


endmodule 


尽管 示例 5. 4 和 示例 5. 5 中 代码 的 描述 看 起 来 完全 不 同 ， 但 它们 描述 的 是 同 
样 的 电路 。 如 果 我 们 将 0 和 1 分 别 分 配 为 0 状态 和 1 状态 ， 该 电路 图 便 可 以 通过 
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状态 机 得 到 。 

比较 尽管 基于 Moore 状态 机 和 Mealy 状态 机 的 设计 都 可 以 在 输入 信号 出 现 
上 升 沿 时 给 出 指示 信号 (tick), 但 两 者 间 还 是 存在 微小 的 差别 。 基 于 Mealy 状态 
机 的 设计 需要 更 少 的 状态 ， 更 快 的 运行 速度 ， 但 是 输出 信号 位 宽 差别 较 大 且 输 入 
信和 号 的 毛刺 信号 容易 传输 给 输出 。 

两 种 设计 方式 的 选择 取决 于 使 用 输出 信号 的 子 系统 。 在 大 多 数 时 候 ， 子 系统 
为 参考 相同 时 钟 信号 的 同步 系统 。 由 于 状态 机 的 输出 信号 只 有 在 时 钟 信 号 的 上 升 
沿 进行 采样 ， 只 要 输出 信号 在 时 钟 沿 附近 能 保持 稳定 ， 位 宽 和 毛刺 影响 便 不 大 。 
注意 ，Mealy 输出 信号 在 t 时刻 可 以 被 采样 ， 而 Moore 输出 信号 在 t, 时 刻 才能 被 
采样 ， 因 此 Mealy 输出 相对 于 Moore 输出 会 快 1 个 时 钟 周期 。 因 此 ， 如 果 电 路 应 
用 更 注重 性 能 的 话 ， 基 于 Mealy 设计 会 更 合适 一 些 。 


5.3.2 APR 


原型 板 上 的 滑动 开关 和 按钮 为 机 械 装 置 。 对 于 按钮 ， 按 下 时 ， 开 关 会 抖动 并 
持续 一 段 时 间 。 拌 动 导致 信号 出 现 如 图 5-8 顶部 所 示 的 毛刺 和 干扰。 抖动 通常 持续 
20ms 左右 。 去 拌 电 路 用 来 滤波 开关 切换 时 产生 的 毛刺 干扰 。 图 5-8 的 底部 给 出 
两 种 基于 状态 机 实现 的 去 拌 电 路 的 输出 方案 。 在 本 节 中 对 第 一 种 设计 方式 进行 讨 
论 ， 在 第 5.5. 2 节 中 对 第 二 种 方式 进行 讨论 ， 在 第 6. 2. 1 节 中 对 另外 一 种 更 好 的 


实现 方式 一 基于 FSMD 的 设计 方式 进行 讨论 。 
抖动 (小 于 20ms) 抖动 (小 于 20ms) 
EAT ry 


原始 开关 信号 输出 


去 村 信号 输出 
PEST 





去 抖 信号 输出 20ms 20ms | 
(方案 2) 


图 5-8 原始 的 和 去 拌 后 的 波形 


基于 状态 机 的 设计 要 用 到 一 个 独立 运行 的 10ms 计数 器 和 一 个 状态 机 。 计 数 
器 每 隔 10ms 产生 一 个 单 周期 的 使 能 指示 信号 (m_ tick 信和 号) ， 状 态 机 通过 跟踪 
该 信号 信息 以 确定 输入 信号 是 否 稳定 。 在 第 一 种 方案 中 ， 状 态 机 忽略 时 间 短 的 抖 
动 ， 只 有 当 输 入 信号 经 过 20ms 的 稳定 后 才 会 改变 去 抖 后 的 输出 。 输 出 的 时 序 图 
如 图 5-8 中 间 部 分 所 示 。 在 图 5-9 中 给 出 状态 机 的 状态 转移 图 。 其 中 状态 0 和 状 
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态 1 分 别 表示 开关 输出 信号 sw 稳定 至 为 0 或 1。 假设 初始 状态 为 状态 0， 状 态 机 
会 在 信号 sw 变 为 1 时 迁移 到 状态 waitl_1。 在 状态 waitl_1 В, 状态 机 等 待 m_tick 
变 为 有 效 。 如 果 在 此 状态 中 ，sw 信号 变 为 0， 则 表示 高 电 平 的 持续 时 间 不 足以 使 
状态 机 跳 转 到 状态 0。 上 述 表现 都 会 在 状态 waitl 2 和 状态 waitl 3 中 重复 两 次 。 
除了 sw 信号 持续 为 0 外 ， 状 态 1 的 操作 与 状态 0 相同 。 


T 
sw' 
sw! * m tick" 








Sw 


` te: Li е > 
ex sw*m tick ew Sw'* m tick 
' sw * m_tick' : sw’ * m tick' 
sw * m tick sw’ б m tick 


s sw'* m tick' 


sw *m tick 


a sw * m tick' 


sw'* m tick 


图 5-9 去 拌 电 路 的 状态 转移 图 
因为 10ms 计数 器 为 独立 运行 的 且 m. tick 信号 可 能 会 在 任意 时 刻 被 置 为 有 
效 ， 状 态 机 通过 三 次 检测 以 保证 sw 信号 持续 时 间 至 少 为 20ms (实际 在 20 ~ 
30ms 之 间 )。 代 码 如 示例 5.6 所 示 。 里 面包 含 10ms 计数 器 和 状态 机 的 实现 。 
示例 5.6 去 拌 电路 状态 机 实现 方式 


module db_fsm 
( 
input wire clk, reset, 
input wire sw, 


output reg db 
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); 

// 状态 符号 声明 

localparam [2:0] 
zero =3”Ь000, 
waitl 1 =3’ b001, 
waitl 2 =3’ b010, 
мані 3 =3’ b011, 
one —3' b100, 
waitü 1 =3 b101, 
ма 2 23'b110, 
ма 3 =3’ bl11; 

// TIS bit #ç(2 ` *20ns = 10ms tick ) 

localparam N = 19; 

// 信号 声 盟 

reg [N- 1:0] q reg; 

wire [N 21:0] q next; 

wire m tick ; 

reg [2:0] state reg, state next; 


// 主体 


always © ( posedge clk) 
q reg «-q next; 
// KE HH 
assign q next = q_reg +1; 
// $i Hi tick 
assign m tick = (q reg 220) ? 1’ bl:1' b0; 


// W: SE E de 
always € ( posedge clk, posedge reset) 
if (reset) 


state reg <= zero; 
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else 
state reg <= state next; 
// VE EUR HUE HE 
always @ x 
begin 
state. next = state reg; // RUAA: Alla] 
db 21" b0; // BRA : 0 
case (state reg) 
Zero: 
if (sw) 
state next = waitl 1; 
waitl 1: 
if ( ^ sw) 
State next = zero; 
else 
if ( m tick) 
state next = wait] 2; 
waitl 2: 
if ( ~sw) 
state_next = zero; 
else 
if ( m tick) 
state next = wait] 3; 
waitl 3: 
if ( ~ sw) 
state next — zero; 
else 
if (т tick) 
state next = one; 
one; 
begin 
db =1’ bl; 
if ( ~sw) 
state next = wait0_1; 


end 
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wait0_1. 
begin 
db =1’ bl; 
if (sw) 
state_next = one; 
else 
if ( m. tick) 
state next = waitÜ 2; 
end 
маш 2: 
begin 
db =1’ bl; 
if (sw) 
state_next = one; 
else 
if (m tick) 
state next = ман 3; 
end 
ман 3: 
begin 
db 21' bl; 
if (sw) 
state_next = one; 
else 
if (m tick) 
state next — zero; 
end 
default; state. next = zero; 
endcase 
end 


endmodule 


5.3.3 测试 电路 
我 们 通过 如 图 5-10 框图 所 示 的 抖动 计数 电路 对 上 升 沿 检测 电路 和 去 拌 电路 
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进行 验证 。 验 证 电路 的 输入 来 自 按钮 式 开 关 。 在 图 5-10 的 下 半 部 ， 信 和 号 先后 经 
过 去 拌 电 路 和 上 升 沿 检测 电路 。 因 此 ， 按 钮 每 按 下 并 被 释放 一 次 ， 就 会 产生 一 个 
单 周期 的 指示 信和 号。 指示 信和 号 控制 使 能 8bit 计数 器 的 输入 ， 计 数 器 的 值 会 传输 给 
分 时 复 用 的 LED 电路 ， 并 显示 在 开发 板 上 的 七 段 数码 管 左 两 位 数字 上 。 在 图 5- 
10 的 上 半 部 分 ， 输 入 信号 不 经 过 去 拌 电 路 而 是 直接 输入 到 上 升 沿 检测 电路 ， 数 
字 会 在 原型 板 上 的 右 两 位 七 段 式 LED 显示 器 上 进行 显示 。 底 部 的 计数 器 在 按钮 
弹 起 时 计数 一 次 0 到 1 状态 的 跃迁 。 





btn[1] 









disp mux hex 
ы Pm 


clk 


图 5-10 ”去 抖 测试 电路 


示例 5.7 中 给 出 了 代码 的 实现 方式 。 主 要 是 通过 元 件 实例 化 的 方式 实现 框图 
的 功能 。 
示例 5.7 去 拌 电 路 和 上 升 沿 检测 电路 验证 电路 实现 代码 


module debounce test 
( 
input wire clk, reset, 
input wire [1:0] btn, 
output wire [3:0] an, 
output wire [7;0] sseg 
ys 
// fs pH] 
reg [7:0] b reg, d reg: 
wire [7:0] b next, d next; 
reg btn reg, db reg; 
wire db level, db tick,btn tick, clr; 
//7 段 式 LED 多 路 时 间 显 示 模 块 示例 


disp_hex_mux disp_unit 
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(. elk( elk) ,. reset( reset) , 
. hex3( b reg[ 7:4] ) ,. hex2(b reg[3:0]) , 
. hexl (d reg[ 7:4] ) , . hexO(d_reg[3:0]), 
. dp in(4' b1011) ,. an(an) ,. sseg(sseg) ) ; 
// ВЕН] 
db. fsm db. unit 
(. elk( clk) ,. reset( reset) ,. sw( btn[ 1]) ,. db(db level) ) ; 
// 党 检测 电路 
always @ ( posedge clk) 
begin 
btn reg <=btn[ 1]; 
db_reg <= db_level; 
end 
assign Ып tick = ~ Ып reg & btn[1]; 
assign db tick = ~ db_reg & db level; 
// Xa TCR 
assign clr = btn[0] ; 
always @ ( posedge clk) 
begin 
, b reg <= b. next; 
d reg <= d next; 


end 
assign b. next = ( clr) 7 8'b0: 
(btn tick) ? b reg * 1:b reg; 
assign d. next = (clr) ?8'b0. 
(db бек) ? d reg & 1:d reg; 
endmodule 


七 段 数码 管 显示 器 显示 了 累积 的 由 0 变 1 的 反弹 边沿 个 数 ， 以 及 经 过 去 拌 处 
理 的 开关 输入 个 数 。 经 过 对 按钮 进行 多 次 的 按 下 和 释放 操作 ， 我 们 可 以 得 到 一 次 
转换 的 平均 反弹 次 数 。 
5.4 文献 备注 


C. E. Cummings 的 文章 “Coding and Scripting Techniques for FSM Designs with 
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Synthesis-Optimized Glitch-Free Outputs” 对 状态 机 不 同 的 编码 风格 进行 了 详细 的 
讨论 。 


5.5 参考 实验 


5.5.1 双 沿 检测 器 


双 沿 检测 器 与 上 升 沿 检测 器 相似 ， 只 是 双 沿 检测 器 要 在 输入 信号 由 0 变 为 
(上 升 沿 ) 和 由 1 变 为 0 (FRW) 时 输出 均 需 要 置 一 个 周期 的 有 效 信号 。 

1) 设计 一 个 基于 Moore 状态 机 的 电路 ， 并 画 出 状态 图 和 ASM K; 

2) 通过 ASM 图 或 状态 图 得 到 HDL 代码 ; 

3) 编写 测试 平台 并 通过 仿真 验证 代码 的 运行 ; 

4) 将 5.3.3 区 中 的 上 升 沿 检测 电路 蔡 换 成 双 沿 检测 电路 ， 并 进行 验证 ; - 

5) 用 基于 Mealy 状态 机 的 设计 重复 上 述 步 又 1 ~4。 


5.5.2 另 一 种 去 拌 电 路 


5.3.2 节 去 拌 电路 的 一 个 问题 是 开关 转换 开始 的 延 时 响应 。 另 外 一 种 方法 是 
只 对 第 一 个 跳 变 沿 进行 反应 ， 然 后 等 待 一 小 段 时间 (至 少 20ms) 以 使 输入 信号 
稳定 。 这 种 方法 的 输出 时 序 图 如 图 5-8 底部 。 当 输入 从 0 变 为 1 时 ，FSM 立即 响 
应 ， 然 后 忽略 后 面 大 约 20ms 的 输入 来 避免 毛刺 。 之 后 ，FSM 再 开始 检查 输入 的 
下 降 沿 。 按 5. 3. 2 节 中 的 设计 流程 设计 这 种 电路 。 

1) 设计 电路 的 状态 图 和 ASM 图 ; 

2) 得 到 HDL 代码 ; 

3) 基于 状态 图 和 ASM 图 得 到 HDL (Š 
码 ; 
4) 设计 测试 平台 并 利用 仿真 来 验证 代 
码 的 运行 情况 ; 

5) 使 用 另 一 种 设计 取代 5.3.3 节 的 去 
拌 电 路 并 验证 其 运行 情况 。 
5.5.3 停车 场 占用 计数 器 

考虑 一 个 只 有 单一 的 人 口 和 出 口 的 停车 
场 。 有 两 对 图 像 传感器 用 于 监视 汽车 的 活 Y 一 = 


ah, 如 图 5-11 所 示 。 当 一 个 物体 在 图 像 发 mu Е 
送 器 和 图 像 接收 器 之 间 时 ， 由 于 光线 被 下。 M 
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挡 ， 因 此 相应 的 输出 就 会 被 置 为 高 电 平 。 通 过 监视 两 个 传感器 的 事件 ， 我 们 可 以 
判断 是 否 有 车 进出 或 者 某 个 行人 经 过 。 举 例 来 说 ， 如 下 事件 序列 表示 有 一 辆 车 进 
入 了 停车 场 : 

e 最 开始 ， 两 个 传感器 都 处 于 未 遮挡 状态 ( 即 信 号 a 与 b 为 “00”); 

e 传感器 a 被 遮挡 ( 即 信 号 a 与 b 为 “10”); 

e 两 个 传感器 均 被 遮挡 ( 即 信号 a 与 b 为 “11”); 

e 传感器 a 遮挡 消失 ( 即 信 号 a 与 b 为 “01”); 

e 两 个 传感器 均 遮 挡 消失 ( 即 信 号 a 与 b 为 “00”)。 

设计 一 个 停车 场 占 用 计数 器 步骤 如 下 : 

1) 设计 一 个 带 有 两 个 输入 信号 (а 和 b)， 两 个 输出 信号 (enter 和 exit) 的 
状态 机 ， 当 一 辆 车 进入 和 出 来 时 ， 分 别 置 位 enter 和 exit 一 个 周期 的 有 效 信号 ; 

2) 设计 状态 机 的 HDL 代码 ; 

3) 设计 一 个 带 有 两 个 控制 信号 (inc 和 dec) 的 计数 器 ， 用 于 增 减 计数 ， 并 
获得 HDL 代码 ; 

4) 将 计数 器 和 状态 机 以 及 LED 多 路 选择 电路 进行 组 合 ， 用 两 个 经 过 去 抖 的 
按钮 模拟 两 个 传感器 的 输出 功能 ， 验 证 该 停车 占用 计数 器 。 


6.1 简介 


带 数据 路 径 的 有 限 状态 机 (FSMD) 是 由 一 个 有 限 状 态 机 和 常规 时 序 电路 组 
合 而 成 的 。 有 限 状态 机 有 时 候 被 称 为 控制 路 径 ， 用 来 检测 外 部 命令 和 状态 并 且 生 
成 控制 信号 ， 以 指定 常规 时 序 电路 的 相应 操作 。FSMD 通过 使 用 RT (寄存 器 传 
输 ) 方法 学 的 描述 来 实现 系统 ， 使 用 这 种 方法 时 ， 相 应 的 操作 被 指定 为 数据 操 
作 和 一 系列 的 寄存 器 传输 。 


6.1.1 单个 RT 操 作 


单个 RT 操作 指 的 是 对 于 单个 目标 寄存 器 的 数据 处 理 和 传输 。 由 以 下 符号 表 

AN: 
Кн CR вава) 

T deat Fee HERRITAR, Tuas r.o r. Е ТЕ, MAOO ) 代 表 当 前 的 操作 。 上 
IRAE SAN SY ER ay Fan JBL PE T АНИ ЯН HB pe KJ РАК /( ， ) ， 而 结果 
传递 给 目标 寄存 器 的 输入 ， 并 于 下 一 个 时 钟 沿 存 人 目标 寄存 器 中 。 以 下 为 几 个 典 
型 的 RT 操作 : 

ө r1—0. 常量 0 被 在 人 寄存 器 rl; 

e rl—rl. rl 寄存 器 的 值 被 重新 写 回 ; 

e 12—12 »»3, ffs 12 右 移 3 位 后 写 回 寄存 器 12; 

e Zr1。 将 寄存 器 zl 的 值 传输 给 寄存 器 r2 ; 

e ie 二 i+1。 寄 存 器 i 中 的 值 自 加 1 后 重新 写 回 到 寄存 器 i rh; 

€ 151 +s2 +s3。 将 寄存 器 sl. 52, 53 的 和 写 人 寄存 器 d'F; 

ө y—a*a, 将 a 的 二 次 方 写 人 y 寄存 器 中 。 

单个 RT 操作 可 以 利用 表示 函数 拟 ，) 的 组 合 逻 辑 电 路 并 连接 输入 和 输出 寄 
存 器 来 实现 。 以 аа -b+1 操作 为 例子 ， 函 数 拟 ，) 会 涉及 一 个 减法 器 和 一 个 
加 法 器 ， 原 理 框图 如 图 6-1a 所 示 。 为 清晰 起 见 ， 我 们 使 用 “_reg” 和 “_next” 后 
缀 表示 寄存 器 的 输入 和 输出 。 需 要 注意 的 是 ， 单 个 RT ЕЕЕ А УРУНА o 
RIZE. ROR, fC ) 的 结果 只 有 在 下 一 个 时 钟 周 期 才能 被 存 人 目标 寄存 器 中 。 
上 一 次 的 RT 操作 时 序 图 见 图 6-1b 
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a) 电路 框图 b) 时 序 图 
图 6-1 单个 RT 操作 的 电路 框图 和 时 序 图 
6.1.2 ASMD 


基于 RT 方法 学 电路 指定 了 每 一 步 应 该 执行 的 RT 操作 。 由 于 RT 操作 是 在 一 
个 时 钟 接着 一 个 时 钟 的 基础 上 完成 的 ， 因 此 它 的 时 序 与 状态 机 的 跳 转 很 相似 。 这 
样 ， 选 择 用 状态 机 来 指定 RT 算法 的 顺序 就 很 自然 了 。 我 们 将 RT 操作 纳入 到 
ASM 图 中 对 ASM 图 进行 扩展 ， 将 其 称 之 为 ASMD ( 带 数 据 路 径 的 ASM) 图 。 这 
种 RT 操作 被 当 作 是 另 一 种 类 型 的 活动 ， 可 用 于 使 用 输出 信号 的 地 方 。 

图 6-2a 为 ASMD 图 的 一 个 片段 。 它 包含 了 将 rl 寄存 器 初始 化 为 8， 然 后 再 
与 之 寄存 器 中 的 值 相 加 ， 最 后 将 结果 左 移 两 位 。 注 意 ， 必 须 在 每 个 状态 都 要 指 
El 寄存 器 。 如 果 zl 寄存 器 的 值 没有 变化 ， 则 使 用 如 S3 中 所 示 的 二-rl 操作 
来 保持 当前 值 。 在 以 后 的 讨论 中 ， 我 们 假定 r—rRT 操作 对 于 了 寄存 器 来 说 是 默 


50) 






































d q 
r2_reg 
state reg ! > 


clk 
a) ASMD}¥ £t b) 电路 结构 图 








图 6-2 ASMD 片断 的 实现 
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认 的 操作 ， 将 不 会 包含 在 ASMD 图 中 。 要 实现 一 个 含 RT 操作 的 ASMD 图 涉及 使 
用 一 个 多 路 选择 电路 将 下 一 个 期 望 值 发 送 至 目标 寄存 器 中 。 例 如 ， 图 6-2b rz 
的 电路 结构 可 以 通过 前 述 章节 中 的 一 个 4 选 1 的 多 路 选择 器 来 实现 。 状 态 机 的 当 
前 状态 〈 即 状态 寄存 器 的 输出 ) 控制 多 路 选择 器 的 选择 信号 并 对 期 望 的 RT 操作 
结果 进行 选择 。 

RT 操作 也 可 以 通过 一 个 条 件 判断 输出 结构 指定 ， 如 图 6-3a 中 的 寄存 器 120 
RER a» b, REULT r22 +a MAM 12:2 +b, HEM, TE ASMD 
BORA ТН PERI FTA IN. deli BLM ab, 12 +а ДЖ 2 «b 操作 ， 
JE HIA EFE da EB AIK 48 т2 АЕК ШЕ 6-3b 所 示 
































state reg 


a) ASM 模 块 b) 模块 框图 
图 6-3 在 一 个 条 件 输 出 盒子 中 实现 RT 操作 
6.1.3 带 寄存 器 的 判决 盒 


乍 看 起 来 ASMD 图 与 正常 的 程序 流程 图 非常 相似 。 主 要 的 不 同 之 处 是 在 
ASMD 图 中 ，RT 操作 是 由 模块 内 嵌 的 时 钟 信号 来 控制 的 ， 并 且 目标 寄存 器 的 值 
的 更 新 发 生 在 FSMD 退出 当前 ASMD 块 时 ， 而 不 是 在 ASMD 块 内 。 表 达 式 rer - 
1 实际 上 意味 着 : 

€ г next zr reg-1; 

ө г reg <= r next 在 时 钟 上 升 沿 执行 ( 即 当 FSMD 退出 当前 块 的 时 候 ) o 

当 寄 存 器 用 于 判决 盒 中 时 ， 这 种 “ 延 时 存储 ”可 能 会 引入 微妙 的 错误 。 思 
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A5 6-4а 所 示 的 FSMD 片段 。 寄 存 器 在 状态 盒 中 递减 且 在 判决 盒 中 使 用 。 由 于 
寄存 器 了 会 一 直 等 到 FSMD 退出 块 时 才 会 更 新 ， 寄 存 器 r 中 的 旧 值 被 用 于 判决 盒 


比较 。 如 果 期 望 的 是 + 的 新 值 ， 那 么 应 





该 在 判决 盒 中 使 用 组 合 逻辑 的 输出 
( 即 r_next) (即使 用 r_next ==0 的 表 
达 来 取代 r==0)， 如 图 64b 所 示 。 


FSMD 模块 框图 FSMD 的 模块 框图 x 
从 形式 上 可 以 分 为 数据 路 径 和 控制 路 | ке | 





fe, Ш 6-5 所 示 。 数 据 路 径 的 执行 需 
要 进行 RT 操作 。 它 包含 : еее ра do Чадена J 
e 数 据 寄存 器 : 存储 中 间 计 算 结 ! 
R, a) 使 用 r 的 前 一 次 值 b) 使 用 r 的 更 新 值 
ө 功能 单元 : 由 一 系列 的 RT 操作 — вл 延 时 存储 对 ASM 模块 的 影响 
完成 功能 ; 
e 布 局 网 络 : 在 功能 单元 和 存储 寄存 器 之 间 布 局 数据 通道 。 











和 输出 值 














外 部 
状态 











图 6-5 FSMD 框图 
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数据 路 径 根 据 控制 信号 执行 期 望 的 RT 操作 并 生成 相应 的 内 部 状态 信号 。 
控制 路 径 是 一 个 有 限 状 态 机 。 它 是 一 个 常规 的 有 限 状态 机 ， 包 含 状态 寄存 
器、 次 态 逻 辑 以 及 输出 逻辑 。 使 用 外 部 命令 信号 和 数据 路 径 的 状态 指示 信和 号 作为 
输入 并 产生 控制 信号 ， 以 控制 数据 流 的 操作 。 状 态 机 还 会 生成 外 部 状态 信号 用 于 
指示 FSMD 的 运行 状态 。 

注意 ， 尽 管 一 个 FSMD 包含 两 种 类 型 的 时 序 电路 ， 但 由 于 两 种 电路 都 是 受到 
相同 的 时 钟 控制 ， 因 此 FSMD 仍 是 一 个 同步 系统 。 


6.2 FSMD 的 代码 开发 


我 们 使 用 一 个 改进 的 去 拌 电 路 来 展示 如 何 得 到 FSMD 的 代码 。 尽 管 去 抖 电路 
在 5.3.2 节 中 使 用 了 一 个 状态 机 和 一 个 计时 器 〈 一 个 常规 时 序 电 路 ) ， 但 是 并 非 
是 基于 RT 方法 学 实现 的 ， 因 此 这 两 个 功能 单元 独立 运行 ， 且 状态 机 并 没有 控制 
计时 器 。 由 于 每 隔 10ms 产生 的 使 能 信号 可 以 在 任意 时 刻 有 效 ， 因 此 ， 当 计时 器 
在 等 待 状态 1_1 或 者 0-1 的 时 候 检测 到 第 一 次 滴 噶 时 ， 状 态 机 并 不 知道 实际 已 经 
经 历 了 多 长 时 间 。 这 样 ， 等 待 周期 虽然 在 20 ~30ms 之 间 ， 但 并 非 准确 值 。 这 种 
误差 可 以 通过 使 用 RT 方法 学 解决 。 在 本 节 中 ， 我 们 使 用 这 个 改进 的 去 拌 电 路 来 
说 明 FSMD 的 代码 开发 过 程 。 


6.2.1 基于 了 RT 方 法 学 的 去 抖 电路 


我 们 在 使 用 状态 机 控制 计时 器 的 初始 化 以 期 获得 准确 的 时 间 间 隔 时 要 用 到 
RT 理论 。ASMD 表 如 图 6-6 所 示 。 这 种 扩展 的 电路 包括 两 个 输出 信号 : db level, 
循环 跳 转 电路 的 输出 ; db_tick， 通 过 一 个 时 钟 周期 脉冲 有 效 沿 来 判断 从 零 状态 到 
一 状态 循环 跳 转 。 零 状态 和 一 状态 分 别 意味 着 输入 sw 已 经 分 别 稳定 到 0 和 1。 
等 待 1 和 等 待 0 状态 一 般 用 于 滤 除 毛刺 。sw 信号 必须 是 某 一 稳定 的 时 间 计 数值 ， 
否则 这 种 状态 跳 转 将 会 被 认为 是 一 个 干扰 信号 。 数 据 流 包括 一 个 21 位 宽 的 寄存 
fit qo 假设 FSMD 最 初 处 于 零 状态 。 当 sw 输入 信和 号 变 为 1 时 ，FSMD 跳 转 到 waitl 
状态 并 且 初 始 化 q 值 为 “1…1”。 当 电路 处 于 waitl 状态 的 时 候 ，d 寄存 器 在 每 个 
时 钟 周 期 都 会 递减 一 次 。 如 果 sw 信号 保持 为 1，FSMD 将 会 反复 进入 这 个 状态 直 
到 q 寄存 器 中 的 值 为 “0…0”， 然 后 进入 one 状态 。 

50MHz 〈 即 周期 为 20ns) 的 系统 时 钟 曾经 通常 被 用 在 原型 板 上 。 由 于 FSMD 
有 2 个 时 钟 周期 处 于 waitl 状态 ， 大 约 是 40ms (і. е., 2" * 20ns) 。 我 们 可 以 通 
过 修改 q 寄存 器 的 初始 值 来 获得 期 望 的 时 间 间 隔 。 

有 两 种 方法 可 以 追溯 HDL 编码 方式 : 一 种 是 数据 流 组 成 的 白 盒 描述 ， 另 一 
种 是 数据 流 组 成 的 黑 盒 描 述 。 
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图 6-6 基于 循环 跳 转 电路 的 ASMD Ж 


6.2.2 带 有 数据 路 径 元 件 的 编码 


进行 FSMD 代码 开发 的 第 一 件 事 就 是 分 离 状 态 机 控制 流 和 关键 数据 流 。 从 
ASMD 图 可 知 ， 首 先 要 识别 数据 和 相关 控制 信号 中 的 关键 元 件 ， 然 后 使 用 独立 的 
代码 段 来 描述 这 些 元 件 。 

去 拌 电 路 的 ASMD 图 的 关键 数据 路 径 元 件 是 一 个 位 宽 为 21 位 的 递减 计数 器 ， 
它 可 以 : 
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e 使 用 特定 值 初始 化 ; 

e 向 下 计数 或 暂停 ; 

e 当 计数 值 到 0 时 会 置 一 个 状态 信号 有 效 。 

我 们 可 以 创建 一 个 二 进 制 计数 器 ， 利 用 q_load 信号 加 载 初始 值 以 及 利用 q_ 
dec 信和 号 使 能 计数 。 计 数 器 也 会 产生 一 个 状态 信号 q_zero， 当 计数 到 0 时 有 效 。 
完整 的 数据 路 径 是 由 一 个 q 寄存 器 和 定制 的 递减 计数 器 的 次 态 逻 辑 组 成 。 还 包含 
一 个 比较 电路 用 于 生成 q_zero 状态 信和 号。 控制 路 径 包 含 一 个 状态 机 ， 它 使 用 了 
sw 输入 信号 和 q_zero 状态 信号 , 并 根据 ASMD 图 中 的 期 望 行为 置 控制 信号 q_load 
和 q_dec 有 效 。HDL 代码 遵循 了 数据 路 径 说 明和 ASMD 图 , 如 示例 6. 1 所 示 。 

示例 6.1 带 有 明确 数据 路 径 元 件 的 去 拌 电路 


module debounce_explicit 
( 
input wire clk, reset, 
input wire sw, 


output reg db level, db tick 


ji 

// 符号 状态 声明 

localparam [1:0] 
zero -2'b00, 
wait? =2’b01, 
one =2’bl0, 
waitl -2'bll; 


// TH AR E Ж. (Q^N *20ns =40ms ) 
localparam N 221; 
// 信号 定义 
reg[ 1 :0 |state_reg, state next; 
reg[ N 2 1:0]q reg; 
wire[ N 2 1:0]q next; 
wire q zero; 
reg q load, q dec; 
// 代码 部 分 
// FSMD 状态 和 数据 寄存 融 
always € ( posedge clk posedge reset ) 
if( reset ) 
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begin 
state_reg <= zero; 
q_reg <=0; 
end 
else 
begin 
state reg < = state next; 
q reg «-q next; 
end 
// FSMD ТЇК SERA ЕЛ S RAE #t 
assign q next = (q load)? {N{1’bl}}: //load 1..1 
(q_dec) ? q reg - 1: // 递减 
q_reg; 
// 状态 信号 
assign q zero = (q next ==0) ; 


// FSMD 项 制 路 径 的 下 一 状态 逻辑 


always @ * 
begin 
state, next = state reg; // 默认 保持 上 一 个 状态 
а load 21" b0; // BRA CB 
q dec =1’ b0; // BRA i EB 
db tick 21' b0; // 默 认输 出 为 低 电 平 
case (state reg) 
Zero: 
begin 
db level =1’ b0; 
if( sw) 
begin 
state. next = waitl ; 
q. load =1’ bl; 
end 
end 
waitl : 
begin 


db level 21" b0; 
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if( sw) 
begin 
q dec = 1’ bl; 
if(q zero) 
begin 
state. next = one; 
db tick 2 1' bl; 
end 
end 
else //sw == 0 
state next — zero; 
end 
one: 
begin 
db_level =1’ bl; 
if( ~sw) 
begin 
state next = wait0; 
q load =1’ bl; 
end 
end 
wait ; 
begin 
db. level =1’ bl; 
if( ~ sw) 
begin 
q dec = 1’ bl; 
if( qq zero) 
state next — zero; 
end 
else// sw == 
state next = one; 
end 


default; state next = zero; 


endcase 
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end 


endmodule 


6.2.3 带 有 隐 含 数据 路 径 元 件 的 编码 


另 一 种 代码 风格 是 在 状态 机 控制 路 径 中 嵌入 RT 操作 。 我 们 仅仅 使 用 对 应 的 
状态 机 状态 来 列举 RT 操作 ， 而 不 是 定义 数据 路 径 元 件 。 去 拌 电 路 的 编码 如 示例 
6.2 所 示 。 

示例 6.2 带 有 隐 含 数据 路 径 元 件 的 去 拌 电路 


module debounce 
input wire clk, reset , 
input wire sw, 


output reg db level,db tick 


уз 
// 符号 化 状态 声明 
localparam [1:0] 
` zero =2’b00, 
wait0 =2’ b01, 
one =2’bl0, 
wal 22'hii; 


// if SCAM GE (2°N *20ns =40ms ) 
localparam N =21; 
// 信号 声明 
reg[ N —1:0]q_reg,q_next; 
reg[ 1:0 ]state reg,state next; 
// 代码 部 分 
// FSMD 状态 和 数据 寄存 带 
always @ ( posedge clk, posedge reset) 
if( reset) 
begin 
state reg <= zero; 
q reg «20; 


end 
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else 
begin 
state reg «— state next; 
q reg «-q. next; 
end 
// PARAS EAGER DI BE POC / Hi Jed 
always @* 
begin 
state next = state reg; // BRIA AH FE BU RA 
q next -q reg; // ТА а RRT 
db tick 2 1' b0; // BRA HHH 0 
case(state reg) 
Zero; 
begin 
db level = 1’ b0; 
if( sw) 
begin 
state next = waitl ; 
q next = |N|1' bl] | ; //load 1..1 
end 
end 
маш ; 
begin 
db level 21' b0; 
if( sw) 
begin 
q next zq reg -1; 
if(q next 220) 
begin 
state next = one; 
db tick 21' bl; 
end 
end 
else// sw == 


State next = zero; 
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end 
one; 
begin 
db level 2 1' bl; 
if( ~sw) 
begin 
state next = ман; 
q next = |N|1' bl | | ;//load 1.. 1 
end 
end 
ман : 
begin 
db level =1 bl; 
if( ~ sw) 
begin 
q_next = q reg - 1; 
if( q- next 220) 
State next = zero; 
end 
else//sw == 1 
state next = one; 
end 
default: state next = zero; 
endcase 
end 


endmodule 


代码 包含 一 段 存储 器 代码 和 一 段 组 合 逻 辑 编 代码 。 前 者 由 状态 机 中 的 状态 寄 
存 器 和 数据 路 径 中 的 数据 寄存 器 组 成 。 后 者 主要 由 状态 机 中 控制 路 径 的 次 态 逻 辑 
指定 。 次 态 数据 寄存 器 中 的 值 是 由 单独 的 状态 指定 的 ， 而 不 是 控制 信号 。 包 括 功 
能 单元 和 路 由 网 络 数据 路 径 的 次 态 逻辑 ， 也 据 此 创建 。 


6.2.4 对 比 


带 有 隐 含 数据 路 径 元 件 的 代码 编码 本 质 遵循 的 是 ASMD 图 。 我 们 仅仅 是 将 
ASMD 图 转换 为 HDL 语言 描述 。 尽 管 这 种 方法 更 简单 而 且 更 容易 描述 ， 我 们 要 
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依赖 于 对 综合 软件 对 数据 路 径 进 行 构造 ， 可 控制 的 地 方 很 少 。 这 点 可 以 通过 一 个 
例子 做 最 好 的 诠释 。 思 考 图 6-7 所 示 的 ASMD 片段 ， 隐 含 的 描述 变 成 了 : 
case(state reg) 
sl; Sa 3 
begin 


dl next =a * b; 


end 
52: 
begin 
d2_next =b * с; 





end 
s3 š 
begin 


d3_ next =a * c; 





end 


图 6-7 通过 共享 的 
ASMD 代码 片段 


endcase 

通过 综合 软件 可 能 推断 出 3 SHA. FAA 
辑 的 乘法 器 是 一 个 复杂 的 电路 ， 对 电路 进行 共享 更 加 高 效 。 我 们 可 以 使 用 显示 描 
ROK} ЖЕЙК: 


case(state reg) 


sl: 
begin 
inl =a; 
in2 =b; 
dl next-2m out; 
end 
52: 
begin 
inl =b; 
in2 =c; 


d2_next = m_out; 
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end 

53 ; 

Беріп 
in] =a; 
in2 =c; 


d3 next 2 m out; 
end 
endcase 


// JA NAM ETE A VR 
//always 模块 的 外 部 
assign m out = inl * in2; 

这 种 编码 方式 保证 了 在 综合 的 时 候 仅 有 一 个 乘法 器 被 推断 出 来 。 这 种 隐 式 描 
述 和 显示 描述 可 以 混合 在 一 个 复杂 FSMD 设计 中 。 出 于 代码 简洁 高 效 考虑 ， 我 们 
经 常 分 离 和 提取 复杂 的 数据 流 元 件 。 


6.2.5 测试 电路 


5.3.3 节 讨 论 的 去 抖 测试 电路 可 用 于 验证 新 设计 的 运行 情况 。 由 于 被 修改 的 
去 拌 电 路 的 输出 包含 一 个 单 时 钟 周期 的 标识 信号 ， 因 此 去 拌 电 路 后 面 不 需要 再 加 
边沿 检测 器 。 修 改 后 的 模块 结构 框图 如 图 6-8 所 示 ， 相 应 代码 如 示例 6. 3 所 示 。 


btn[1] 


















Sw db tick disp mux hex 


clk 消除 





图 6-8” 跳 转 电 路 测试 电路 
示例 6.3 去 拌 电 路 的 验证 电路 


module debounce_fsmd_test 
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( 
input wire clk , reset , 
input wire[ 1 :0 ] btn, 
output wire[ 3:0 ]an, 
output wire[ 7 :0 | sseg 
ys 
// fg tz a HJ] 
reg [7:0] b reg,d reg; 
wire [7:0] Ь next,d next; 
reg btn reg; 
wire db. tick,btn tick ,clr; 
// МНЕ? ВТЕР 多 路 显示 时 间 电 路 模块 
disp_hex_mux disp_unit 
( .clk (clk) ,. reset( reset) , 

. hex3( b reg[ 7:4 ]) ,. hex2(b reg[3:0]) , 

. hexl (d reg[ 7:4] ) ,. hex0(d reg[3:0]) , 

. dp in(4' b1011), .an(an),. sseg(sseg) ) ; 
// 和合 化 循环 跳 转 电路 模块 
debounce db_unit 
(. сІК( clk) ,.reset(reset),.sw(btn[1]), 
zs. db_level( ) ,. db tick(db tick) ) ; 
// XE AR ABR RO A ETT TA EU E Hi p# 
always @ ( posedge clk) 
btn reg <= btn[ 1]; 
assign btn tick = ~ btn reg & btn[ 1]; 
// BUT tt Bat 
assign clr =btn[0] ; 
always @ ( posedge clk) 

begin 
d reg <= 4 next; 
b reg <= b next; 
end 
ИЗ 806 
assign b. next = (clr)? 0: 
(btn tick)? b -reg +1; 
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b reg; 

assign d next = (clr)? 0: 
(db tick)? d reg +1; 
d reg; 


endmodule 


6.3 设计 实例 


6.3.1 ЗЕ аза 


斐 波 纳 契 数字 构成 了 一 个 序列 ,定义 如 下 : 

0 ШЖ i-0 
at- WR i=l 
b(i-1) +fib(i-2) 如 果 i»2 

一 种 计算 fiw(i) 的 方法 是 反复 调用 函数 ， 从 0 到 要 求 的 值 i。 这 一 方法 需要 
两 个 临时 寄存 器 ， 用 于 存储 两 个 最 近 计 数值 [ 即 fib(i-1) 和 fi6(i-2)]， 以 及 一 
个 索引 寄存 器 用 于 追踪 迭代 数字 。 如 图 6-9 所 示 为 ASMD P, tl 和 为 临时 寄 
FERR, n 为 索引 寄存 器 。 除 了 常规 数据 输入 /输出 信号 1 和 f 外 ， 我 们 还 要 包括 一 
个 用 于 指示 开始 的 命令 信号 start 以 及 两 个 状态 信号 : 一 个 是 ready， 用 于 指示 电 
路 是 空闲 状态 并 可 以 采样 新 的 输入 值 ; 另 一 个 是 结束 指示 信和 号 ， 用 于 判断 操作 完 
成 是 否 经 历 了 一 个 时 钟 周期 。 类 似 许多 其 他 FSMD 的 设计 ， 由 于 这 种 电路 有 可 能 
是 一 个 庞大 系统 设计 的 一 部 分 ， 这 些 信 号 需要 跟 其 他 子 系统 进行 接口 。 

ASMD 图 有 三 种 状态 。idle 状态 表示 当前 电路 处 于 空闲 。 当 start 信号 有 效 
时 ，FSMD 跳 转 为 op 状态 并 载 人 初始 值 至 3 个 寄存 器 。t0 和 tl 寄存 器 分 别 被 载 
入 0 和 1, 分 别 代表 fw(0) 和 fib(1)。 寄 存 器 n 载 人 预期 的 迭代 次 数 io 

主要 的 运算 通过 3 次 RT 操作 反复 进入 op 状态 来 实现 : 

ө tl 一 tl +10; 

e (0—11; 

€ n—n-1, 

前 两 次 RT 操作 获取 一 个 新 值 并 将 两 个 最 近 计 算得 到 的 t 和 to 值 存储 。 第 
三 次 RT 操作 将 迭代 索引 减 1。 当 nn 值 为 1 或 者 它 的 初始 值 为 0[ 即 f8(0) ] 时 ,个 
Ш 与 常规 的 流程 图 不 同 ， 在 一 个 ASMD 块 中 的 所 有 操作 可 以 在 同一 个 时 
钟 周期 并 行 执行 。 我 们 将 所 有 的 比较 和 RT 操作 都 放 入 op 状态 中 ， 以 减少 计算 
时 间 。 注 意 t 和 to 的 寄存 器 中 的 最 新 值 在 当 FSMD 退出 op 状态 (即时 钟 的 下 一 
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个 上 升 沿 ) 时 同时 被 更 新 。 这 样 ，tl 的 原始 值 ， 而 非 t+t0， 被 存储 在 O 中 。 
done 状态 的 作用 是 生成 一 个 单 时 钟 周期 信号 done-tick 用 来 指示 计算 完成 。 如 果 
这 个 状态 信号 不 需要 ， 则 这 个 状态 可 以 被 省 略 。 








idle 




















图 6-9 斐 波 纳 契 电路 ASMD 图 


代码 按 ASMD 图 进行 设计 ， 如 示例 6.4 所 示 。 注 意 ， 斐 波 纳 契 函数 增长 迅 
速 ， 输 出 信号 的 位 宽 要 足够 宽 以 适应 期 望 结 果 。 
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示例 6.4 斐 波 纳 契 数 电路 


module fib 
( 
input wire clk, reset, 
input wire start , 
input wire [4:0] i, 
output reg ready, done tick, 
output wire [ 19:0] f 
ds 
// 符号 化 状态 声明 
localparam [1:0] 
idle =2'b00, 
op -2'b0l, 
done=2’ b10; 
// 信号 声明 
reg [1:0] state reg, state next; 
reg [19:0] Ю reg, t0 next, t1. reg, tl. next; 
reg [4:0] n reg, n next; 
// 代码 部 分 
// FSMD ARAS US ay FF at 
always @ ( posedge clk, posedge reset) 
if (reset) 
begin 
state reg <= idle; 
(0 reg <=0; 
tl reg «20; 
n reg <=0; 
end 
else 
begin 
state reg <= state next; 
(0 reg <= 10. next; 
tl reg <= tl next; 


n reg «-n next; 
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end - 

//FSMD 'F—JdJ 63e 18 
always (9* 
begin 

state next — state reg; 

ready =1’ b0; 

done tick 21" b0; 

t0. next = t0. reg; 


t]. next =11 reg; 
n next —-n reg; 
case (state reg) 
idle; 
begin 
ready =1 bl; 
if (start) 
begin 
10. next =0; 
tl. next =20’ 41; 
n next =i; 
state next = op; 
end 
end 
op: 
if(n reg ==0) 
begin 
tl, next 20; 
state next = done; 
end 
else if(n reg == 1) 
state next — done; 
else 
begin 
tl next ztl reg + 10 reg; 
t0 next = tl_reg; 


n next = п reg - 1; 
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end 
done: 
begin 
done tick 21" bl; 
state next = idle; 
end 
default; state. next = idle; 
endcase 
end 
// 输出 
assign f = 11 тер; 


endmodule 


6.3.2 除法 电路 


由 于 除法 操作 的 复杂 性 ， 除 法 运算 不 能 被 直接 自动 综合 。 在 这 一 章节 中 我 们 
通过 使 用 FSMD 来 实现 长 除法 运算 。 算 法 通过 两 个 Abit 无 符号 整 型 数 的 除法 来 说 
明 ， 如 图 6-10 所 示 。 算 法 总 结 如 下 : = 

І) 通过 在 高 位 添加 “0” 的 方式 来 双 倍 扩展 on o 66001 LOL Мек 








被 除数 位 宽 ， 并 将 除数 与 扩展 后 被 除数 最 左 位 对 
齐 ; 0000 
0011 
2) 如 果 对 应 的 被 除数 位 宽大 于 或 者 等 于 除 0010, 
数 ， 则 从 被 除数 中 减 去 除数 并 将 对 应 商 值 位 置 1。 0010 
否则， 保持 原始 除数 位 ， 并 将 对 应 商 值 位 置 0。 0001 一 余数 
3) 在 上 一 次 结果 中 增加 一 个 额外 的 被 除数 位 图 6-10 两 个 4bit 无 符号 
并 且 将 除数 右 移动 一 位 ; 整 型 数 长 除法 


4) 重复 步骤 2 和 3 直到 所 有 被 除数 位 数 都 被 除 尽 。 

数据 路 径 的 结构 如 图 6-11 所 示 。 首 先 ， 除 数 被 放 人 寄存 器 d 并 且 经 过 扩展 
的 被 除数 被 放 入 寄存 器 由 和 1。 在 每 次 循环 中 ，rh 和 rl 寄存 器 被 左 移 一 位 。 除 
数 在 原先 的 运算 结果 上 向 右 进行 相应 的 移动 。 如 果 寄 存 器 rh 中 的 值 (余数 ) 远 
远大 于 或 者 等 于 寄存 器 а 中 的 值 〈 除 数 ) ， 我 们 就 将 中 ЯП 4 中 的 值 进行 比较 相 
减 。 当 中 和 rl 中 的 值 左 移 到 相应 的 位 置 ，rl 中 最 右 端的 比特 位 数 变 为 可 用 。 可 
以 用 来 存储 当前 的 商 数 比特 。 当 我 们 将 所 有 的 被 除数 位 宽 除 尽 时 ， 最 后 不 能 整除 
的 即 为 余数 存储 在 寄存 器 中 中， 所 有 的 商 数位 宽 都 移 人 寄存 器 了 l。 
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图 6-11 除法 电路 的 数据 流向 缩 略 图 

除法 电路 的 ASMD 图 与 之 前 的 斐 波 纳 契 电路 有 些 相 似 。FSMD 由 4 个 状态 组 
成 : idle, op, last 和 done。 为 了 代码 清晰 起 见 ， 我 们 将 比较 和 减法 电路 从 代码 
片段 中 分 离 出 来 。 主 要 的 运算 功能 在 op 状态 中 实现 ， 被 除数 和 除数 在 这 个 状态 
中 进行 比较 并 相 减 然后 左 移 一 位 。 注 意 ， 在 最 后 一 次 迭代 运算 中 余数 不 应 被 移 
位 。 我 们 创建 了 一 个 单独 的 状态 last， 以 适应 这 个 特殊 要 求 。 与 之 前 的 例子 一 
FÉ, done 状态 的 作用 是 用 来 生成 一 个 单 时 钟 周期 的 done-tick 信和 号 用 来 指示 计算 
的 完成 。 代 码 如 示例 6. 5 所 示 。 

示例 6.5 除法 电路 


module div 
# ( 
parameter W =8, 
CBIT=4 //CBIT-log2 (W) +1 


input wire clk, reset, 
input wire start, 
input wire [W —1: 0] dvsr, дупа, 
output reg ready, done tick, 
output wire [W -1; 0] quo, тта 
)s 
// 符号 化 状态 定义 
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localparam [1: 0] 


idle -2' b00, 

op -2' ЫІ, 

last =2’ b10, 

done=2’ bll; 
// fi FAY 


reg [1: 0] state reg, state next; 
reg [W —1: 0] rh reg, rh next, rl reg, rl next, rh tmp; 
reg [W -1: 0] d reg, d next; 
reg [CBIT - 1; 0] n reg, n next; 
reg q bit; 
// 代码 部 分 
// FSMD TAS RICE SERE 
always @ (posedge clk, posedge reset) 
if (reset) 
begin 
state reg <= idle; 
rh reg <=0; 
rl reg «2-0; 
d reg «20; 
n reg «20; 
end 
else 
begin 
state, reg < = state next; 
rh. reg <= rh. next; 
rl reg <= rl. next; 
d reg <= і next; 
n reg «-n next; 
end 
// FSMD FHRA 
always @ +* 
begin 
state next = state reg; 


ready -1' b0; 
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done tick =1” b0; 
rh. next = rh. reg; 
rl next = rl reg; 
d next = d reg; 
n next -n reg; 
case (state reg) 
idle: 
begin 
ready =1’ bl; 
if ( start) 
begin 
rh. next 20; 
rl next dvnd; /被 除数 
d. next = dvsr; // 除数 
n nex = СВІТ; — // 指示 位 
state next = op; 
end 
end 
op: 
begin 
// Z: rh 和 rl 
rl next= |rl reg [W -2: 0], q Ы; 
rh next = |rh tmp [W -2: 0], rl reg [W -1]]; 
// 指数 下 降 
n next =n_reg-1; 
if (n next 221) 
state next = last; 
end 
last; // Ap К: 
begin 
rl_next= {ті reg [W -2; 0], q Ы; 
rh. next = rh. tmp; 
state next = done; 
end 


done: 


第 6 章 带 数 据 路 径 的 有 限 状态 机 (175 





begin 
done tick =1’ bl; 
state next = idle; 
end 


default; state next = idle; 


endcase 
end 
// HPI HH pf 
always @ * 
if (rh_reg > = d_reg) 
begin 
rh. tmp = rh. reg — d reg; 
q bit Z1" bl; 
end 
else 
begin 
rh. tmp = rh. reg; 
q bit z1' b0; 
end 
// 输出 


assign quo = rl reg; 
assign тта = rh reg; 


endmodule 


6.3.3 ”二进制 向 BCD 码 转换 电路 


在 4.5.2 节 我 们 讨论 了 BCD 码 的 格式 。 在 这 种 格式 下 ， 一 个 十 进 制 数 可 以 
用 一 个 4 位 的 BCD 数 序列 表示 。 一 个 二 进 制 向 BCD 码 转换 电路 将 一 个 二 进 制 数 
转换 为 BCD 码 形式 。 例 如 ， 二 进 制 数 “0010 0000 0000” 经 过 转换 变 为 “0101 
0001 0010” (H]512,,) 。 

二 进 制 码 向 BCD 码 的 转换 可 以 通过 一 个 专门 的 BCD 移 位 寄存 器 处 理 ， 它 将 
二 进 制 数 分 成 4 位 一 组 ， 每 组 代表 一 个 BCD 数 。 如 果 向 BCD 数 比 移动 后 的 小 ， 
向 左 移动 的 BCD 序列 就 需要 调整 。 举 例 来 说 ， 如 果 一 个 BCD 码 序列 是 
“0001 0111”( 即 17,) ， 它 应 该 变 为 “0011 0100” ( 即 十 进 制 的 34) mid 
“0010 11 10”。 这 种 调整 需要 从 右边 的 BCD 码 中 减 去 一 个 十 进 制 的 10 (Hp 
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“1010”) ， 然 后 对 下 一 个 BCD 码 加 1 (可 以 看 作 是 进位 ) 。 需 要 注意 的 是 ， 对 于 
一 个 4 位 宽 的 二 进 制 数 来 说 ， 减 去 一 个 十 进 制 的 数值 10 相当 于 加 上 一 个 十 进 制 
的 数值 6。 这 样 ， 前 述 调整 也 可 通过 在 正确 的 BCD 码 上 增加 十 进 制 的 6 完成 。 该 
进位 为 进程 中 自动 生成 。 

在 实际 的 实现 中 ， 首 先 对 BCD 码 进 行 必要 的 调整 然后 再 移 位 更 为 高 效 。 可 
以 检查 一 个 BCD 码 是 否 大 于 十 进 制 的 数码 4， 如果 是 ， 便 在 这 个 数值 上 再 加 一 
个 十 进 制 的 3。 当 所 有 的 BCD 码 经 过 校正 以 后 ， 便 可 以 将 整个 寄存 器 向 左 移动 
一 位 。 一 个 二 进 制 向 BCD 码 转换 电路 可 以 通过 将 二 进 制 输入 按 位 从 MSB 到 LSB 
移 位 构建 。 操 作 总 结 如 下 : 

1) 对 于 BCD 移 位 寄存 器 中 4 位 宽 的 BCD 码 的 每 位 数字 ， 检 查 是 否 大 于 4。 
如 果 是 ， 则 加 十 进 制 3; 

2) 将 整个 BCD 码 寄存 器 左 移 1 位 ， 并 且 将 输入 二 进 制 数 的 MSB 移 人 BCD 
寄存 器 的 LSB rh; 

3) 重复 步骤 1、2 直到 所 有 的 输入 位 宽 全 部 使 用 。 

тън 位 宽 的 二 进 制 输入 “1111111”( 即 十 进 制 的 127) 的 转换 过 程 见 表 6-1。 

表 6-1 二 进 制 码 向 BCD 码 转 换 实例 
专用 BCD 码 移 位 寄存 器 





































































# И 二 进 制 码 输 入 
BCD 码 2 | BCD i 1 | BCD #4 0 
初始 化 | | 111 1111 
poit 无 调整 1 
第 6 比特 无 移 1 位 (19) 11 1111 
无 调整 ll 
第 5 比特 XX (lu) 11111 
无 调整 11 
аә 左 移 1 位 (30) MN 
1010 
BCD 数字 0 调整 1 
第 3 比特 左 移 1 位 (lo) 0101 111 
(510) 
кор 1 1000 
第 2 比特 — 11 0001 11 
; = (310) (1j) 
m 无 调整 110 0011 
эшк 左 移 1 位 (б) (3) l 
-一 一 一 一 一 一 
0011 
BCD 数字 1 调整 
SN ет (т) 
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13 位 宽 转 换 电路 代码 如 示例 6.6 所 示 。 它 使 用 了 一 个 简单 的 FSMD 来 控制 
所 有 的 操作 。 当 start 信和 号 被 置 为 有 效 时 ， 二 进 制 输入 被 存储 在 p2s 寄存 器 中 。 与 
前 述 例子 中 的 进程 描述 相似 ， 状 态 机 反复 迭代 13bit 的 输入 数据 。4 个 调整 电路 
被 用 来 修正 4 个 BCD 码 。 为 了 清晰 起 见 ， 它 们 从 次 态 逻辑 中 被 分 离 了 出 来 ， 并 
用 单独 的 代码 段 进行 了 描述 。 
示例 6.6 ”二进制 码 向 ВСЮ 码 转换 电路 


module bin2bcd 
( 
input wire clk, reset, 
input wire start, 
input wire [12:0] bin, 
output reg ready , done. tick , 
output wire [3:0] bcd3 ,bcd2 , bedl ,bcd0 
i 
// 状态 符号 化 定义 
localparam [1: 0] 
idle =2 'b00, 
op =2'b01, 
done =2 'bl0; 
J 1 fe FER 
reg [1:0] state reg ,state next; 
reg [12:0]  p2 sdreg,p2s next; 
reg [3: 0] n reg ,n next; 
reg [3:0]  bed3 reg,bed2 reg,bedl reg ,bedO reg; 
reg [3:0] bed3 next ,bed2 next ,bedl next ,bedO. next; 
wire [3:0] БеЗ tmp,bed2 tmp ,bedl tmp ,bedO tmp; 
// REW 
// FSMD ARAS RUE SETE E 
always Q ( posedge clk ,posedge reset) 





if (reset) 
begin 
state reg «- idle; 
p2s reg <=0; 
nreg . <=0; 
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bcd3_reg < 
bcd2_reg <= 
bedl_reg < 
bcd0_reg < 
end 
else 
begin 
state reg «-state next; 
p2s reg «- p2s next; 
n reg «-n next; 
bcd3 reg <= bced3 next; 
bcd2 reg <= bed2 next; 
bedl reg <= bedl next; 
bcdO0 reg <= bedO next; 
end 
// FSMD FREH 
always Q * 
begin 
state next — state reg; 
ready = 1’ b0; 
done tick 2 1" b0; 
n next -n reg; 
case (state reg) 
idle : 
begin 
ready = 1' bl; 
if (start) 
begin 
state_next = op; 
bed3_next =0; 
bcdl_next 20; 
bedO. next =0; 
n next z4' b1101; // 25] 
p2s. next = bin; // {Уй FF 4 


state next — op; 
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end 
end 
op: 
begin 
// 二进制 码 移 位 
p2s_next =p2s_reg < < 1; 
//4 f VEIT 
// | bed3. next , bed2_next , bed1_next , bcd0 next ) } 
// | bed3 tmp [2 : 0 ] , bcd2 tmp , bedl tmp , bcdO tmp , 
//p2s reg [12] ] 
bed0. next = | bedO_tmp [2: 0] ,p2s reg [12]] 
bed1_next = | bedl. tmp [2:0] ,bedO tmp C311} 
bed2_next = | bed2. tmp [2:0] ,bedl tmp [31]] 
bed3_next = | bed3. tmp [2:0] ,bed2 tmp [31] | 
n nex =n reg l; 
if (n next = 20) 
state next = done; 
end 
done: 
begin 
done, tick =1’ bl; 
state next = idle; 
end 
default:state next = idle; 
endcase 
end 
// 数据 流 功 能 单元 
assign bcd0_tmp = (bedO_reg > 4) ? bedO_reg +3 : bcdO reg; 
assign bedl tmp = (bedl reg > 4) ? bedl reg +3 : bcdl reg; 
assign bed2 tmp = ( bed2 reg > 4) ? bed2 reg +3 : bed2 reg; 
assign bed3. tmp = ( bed3, reg > 4) ? bed3 reg +3 ; bcd3 reg; 
// 输出 
assign bed0 = bedO reg; 
assign bed! = bedl reg; 
assign bed2 = bcd2 reg; 
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assign bed3 = bed3 reg; 


endmodule 


6.3.4 周期 计数 器 


周期 计数 器 用 于 测量 周期 性 的 输入 波形 的 周期 。 一 种 构造 方式 是 计算 输入 信 
号 的 两 个 上 升 沿 之 间 的 时 钟 周期 个 数 。 由 于 系统 时 钟 的 频率 是 已 知 的 ， 因 此 输入 
信号 的 周期 可 以 被 算出 。 例 如 ， 如 果 系 统 时 钟 周期 是 /而 在 两 个 上 升 沿 之 间 的 时 


钟 半期 个 数 是 w， 可 以 推断 出 输入 信号 的 周期 是 + C, 


在 这 一 小 节 中 ， 设 计 的 测量 精度 是 毫秒 级 。ASMD 图 如 图 6-12 所 示 。 当 start 
信号 有 效 时 ， 周 期 计数 器 开始 执行 测量 。 我 们 使 用 一 个 上 升 沿 检测 电路 来 生成 一 
个 单 时 钟 周期 的 标识 信号 ， 表 示 输 入 波形 信号 的 上 升 沿 。start 信号 有 效 后 ， 
FSMD 跳 转 到 waite 状态 ， 等 待 输入 信和 号 的 第 一 个 上 升 沿 。 当 检测 到 输入 的 第 二 
个 上 升 沿 时 ，FSMD 进入 count 状态 。 在 count 状态 中 ， 我 们 使 用 两 个 寄存 器 来 妃 
踪 时 间 。t 寄存 器 可 以 计算 50, 000 个 时 钟 周期 从 0 -49, 999 再 重新 开始 。 由 
于 系统 的 时 钟 周期 是 20ns, t 寄存 器 用 50, 000 个 时 钟 周期 来 计算 Ims; p 寄存 
器 以 ms 为 单位 进行 计数 ， 每 当 t 寄存 器 到 达 49, 999 时 加 1。 当 FSMD 退出 
count 状态 ， 输 入 波形 的 周期 被 存 和 人 р 寄存 器 且 它 的 单位 是 ms。 与 前 面 例子 一 
FÉ, FSMD 在 done 状态 时 置 done _ tick 信号 有 效 。 

程序 代码 在 示例 6.7 中 给 出 。 使 用 一 个 常量 CLK_MS_COUNT 作为 毫秒 计数 
器 的 边界 值 ， 如 果 需 要 使 用 男 一 个 测量 单位 ， 则 它 可 以 被 蔡 换 。 

示例 6.7 周期 计数 器 


module period_counter 
( 
input wire clk , reset , 
input wire start ,Si , 
output reg ready , done tick, 
output wire [9:0 | рга 
}3 
// 状态 符号 化 定义 
localparam [1:0] 
idle =2’b00, 
waite =2”Ь01, 
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done tick 





done 











周期 计数 器 的 ASMD 图 


图 6-12 
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count =2'b10, 
done -2'bll; 
// d tt FA 
localparam CLK. MS. COUNT = 50000; // 计时 
// fg Pi] 
reg [1:0] state reg,state next; 
reg [15:0] t reg,t next; // Ix XH 50000 
reg [9:0] p reg,p next; // MAHI f 
reg delay reg; 
wire edg; 
// 实体 
// FSMD ARASH Py fr ds 
always @ ( posedge clk , posedge reset ) 
if ( reset) 
begin 
state reg <= idle; 
t reg <=0; 
p_reg <=0; 
delay_reg <=0; 
end 
else 
begin 
state_reg <=state_next; 
t_reg <=t_next; 
p_reg <=p_next; 
delay reg <=si; 
end 
// EH tick 
assign edg = ~ delay reg & si; 
// FSMD Р 3:219 
always @ * 
begin 
state next —state reg; 
ready = 1’ b0; 
done. tick = 1' b0; 
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p. next = p. reg; 
L| next =t reg; 
case (state reg) 
idle: 
begin 
ready =1 bl; 
if (start) — 
state next = waite; 
end 
waite: // SEES —T rf Ac 
if ( edg) 
begin 
state next = count; 
t next 20; 
p. next 20; 
end 
count: 
if (edg)// 第 二 个 沿 到 达 
state_next = done; 


else// 否则 计数 


if (t тер = = СІК MS COUNT -1) //1 ms tick 


begin 
t next 20; 
p next =р reg + 1; 
end 
else 
t next -t reg + 1; 
done: 
begin 
done tick 21" bl; 
state next = idle; 
end 
default; state. next = idle; 


endcase 
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// 输出 
assign prd = p reg; 


endmodule 


6.3.5 精确 的 低频 计数 器 


频率 计数 器 可 以 测量 一 个 周期 性 输入 波形 的 频率 。 通 常 的 方法 是 构建 一 个 频 
率 计数 器 在 一 段 固定 的 时 间 内 计算 输入 脉冲 的 个 数 ， 比 如 说 ls。 尽 管 这 种 方法 
对 于 高 频 输入 来 说 还 不 错 ， 但 这 种 方法 无 法 精确 地 测量 一 个 低频 信号 。 例 如 ， 如 
果 输 入 是 2Hz 左右 ， 测 量 便 无 法 准确 区 分 是 2.213Hz 还 是 2. 567Hz。 回 忆 一 下 ， 
顷 率 是 周期 的 倒数 ( AER =) 。 另 一 个 方案 是 测量 信号 的 周期 然后 取 倒数 
求 得 频率 。 在 这 一 小 节 中 我 们 使 用 这 种 方法 来 实现 一 个 低频 率 计数 器 。 

这 个 设计 展示 了 如 何 使 用 一 个 预先 设计 好 的 部 分 来 构建 一 个 更 大 的 系统 。 为 
简单 起 见 ， 我 们 假设 输入 的 频率 在 1 ~ 10Hz (周期 在 100 ~ 1000ms 之 间 ) 。 电 路 
的 运行 包含 MES: 

1) 测量 周期 ， 

2) 通过 实现 除法 运算 来 求 得 频率 ; 

3) 转换 二 进 制 码 为 BCD 码 形式 。 

我 们 可 以 使 用 周期 计数 器 、 除 法 电路 以 及 二 进 制 向 BCD 码 转换 电路 来 实现 
这 三 种 任务 并 且 通 过 创建 另 一 个 FSM 作为 主 控 ， 榨 制 协调 3 个 电路 的 运行 。 电 
路 模块 框图 如 图 6-13a 所 示 ， 主 控 的 ASM 图 如 图 6-13b 所 示 。FSM 电路 的 чан 
信号 和 done. tick 信号 用 来 初始 化 每 个 任务 和 监测 任务 是 否 执行 完毕 。 代 码 如 示 
例 6.8 所 示 。 

示例 6.8 低频 率 计数 器 


module low_freq_counter 

( 

input wire clk, reset, 

input wire start,si, 

output wire [3:0] Ьсаз ,bed2 , bedl , bedO 
JE 
// 状态 符号 化 定义 
localparam [1:0] 

idle =2'b00, 
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Start 





done tick 


一 周期 计数 器 





a) 顶层 模块 图 


























b) ASM 表 的 主要 控制 
图 6-13 ”低频 精确 率 计数 器 
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count =2'b01, 
im =2'МЫ0, 
b2b -2'bll; 


// 信号 声明 

reg [1:0] state reg,state next; 

wire [9:0 | prd; 

wire [ 19:0 ] dvsr, дупа, quo; 

reg prd start, div. start,b2b start; 

wire prd done tick,div done tick,b2b done tick; 


// PALE IAAT BE 
period_counter prd_count_unit 
(. clk( clk) ,. reset( reset) ,. start( prd start) ,. si(si) , 
. ready( ) ,. done_tick( prd_done_tick) ,. prd( prd) ) ; 
// PALE RE EEK 
div #(. W(20) ,. CBIT(5) ) div unit 
(. elk( clk) ,. reset( reset) ,. start( div start), 
. dvsr( dvsr) ,. dvnd( дупа) ,. quo( quo) ,. rmd( ) , 
. ready( ) ,. done tick( div done tick) ) ; 
// 例 化 二 进 制 码 向 BCD Рё 
bin2bed b2b_unit 
(. clk( clk) ,. reset( reset) ,. start( b2b. start) , 
. bin( quo[ 12:0] ) ,. ready( ) ,. done tick(b2b. done tick) , 
. bed3( bed3) ,. bed2( bed2) ,. bedl (Беат) ,. bedO( bed0) ) ; 
// dri E tz FEA 
assign Чупа = 20' 41000000; 
assign dvsr = | 10° bO, рга! ; 


always @ ( posedge clk , posedge reset) 
if ( reset) 


state reg «- idle; 
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else 
state reg «- state next; 
always @ * 
begin 
state next — state reg; 
prd. start = 1' b0; 
div. start 2 1' b0; 
b2b start = 1' b0; 


case (state reg) 


idle: 
if (start) 
begin 
prd start =1’ bl; 
state_next = count; 
end 
count; 
if (prd done tick) 
begin 
div. start 2 1' bl; 
state next = frq; 
end 
frq: 
if (div done tick) 
begin 
b2b start =1’ bl; 
state next = b2b; 
end 
b2b: 
if (b2b done tick) 
state next = idle; 
endcase 


end 


endmodule 
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6.4 文献 备注 


FSMD 通常 会 在 高 层次 综合 的 背景 下 讨论 。D. D. Gajsk 的 《high - level syn- 
thesis. Principles of Digital Design》 一 书 中 包含 了 一 个 全 的 章节 ， 讨 论 了 相关 的 内 
容 和 FSMD 算法 的 设计 和 实现 。 


6.5 实验 


6.5.1 另 一 种 去 拌 电 路 


思考 5. 5. 2 节 实 验 中 的 跳 转 电路 。 使 用 RT 方法 学 重新 设计 电路 : 
1) 设计 电路 的 ASMD 图 ; 

2) 设计 基于 ASMD 图 的 HDL 代码 ; 

3) 用 新 的 设计 替换 6.2.5 节 中 的 去 拌 电路 ， 并 验证 其 操作 。 


6.5.2 BCD 码 向 二 进 制 码 转换 电路 


一 个 BCD 码 向 二 进 制 码 转换 电路 将 一 个 BCD 数 转换 为 一 个 与 其 相等 的 二 进 
制 数 表示 。 假 设 输入 信和 号 是 一 个 8bit 的 BCD 码 格式 信号 (也 就 是 两 个 BCD $3) , 
输出 是 一 个 7bit 的 二 进 制 表示 信号 。 按 照 6.3.3 节 中 的 步 又 设 计 一 个 BCD 码 向 
二 进 制 码 转换 电路 : 

1) 设计 转换 算法 和 ASMD Bj; 

2) 设计 基于 ASMD 图 的 HDL 代码 ; 

3) 设计 测试 平台 并 且 通 过 仿真 验证 代码 运行 ; 

4) 综合 电路 ， 对 FPGA 进行 编程 并 验证 其 运行 。 


6.5.3 带 有 BCD LO 的 斐 波 纳 契 电路 : 设计 方法 I 


为 了 使 斐 波 纳 契 电路 的 应 用 更 为 友好 ， 我 们 可 以 修改 电路 ， 使 用 BCD 码 输 
入 和 输出 。 假 设 输入 是 一 个 8bit 的 BCD 码 信 号 (也 就 是 两 个 BCD 码 ) 而 输出 用 
BCD 码 在 七 段 LED 数码 管 显示 。 然 而 ， 当 斐 波 纳 契 数 列 的 结果 大 于 9999 (也 就 
是 数值 越界 ) 时 ，LED 数码 管 将 会 显示 “9999”。 这 种 运算 可 以 分 为 三 步 来 执 
17: 中 将 输入 转换 为 二 进 制 编 码 形式 ; Qe EN RRS; @ 将 结果 转换 回 
BCD 格式 。 

第 一 种 设计 方法 遵循 6. 3. 5 节 提 供 的 程序 步骤。 首先 创建 3 个 小 的 子 系统 ， 
分 别 是 BCD 码 向 二 进 制 码 转换 电路 ， 斐 波 纳 契 电路 ， 二 进 制 向 BCD 码 转换 电 
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路 ， 然 后 使 用 一 个 主 状 态 机 来 控制 所 有 的 操作 。 电 路 的 设计 流程 如 下 所 示 : 
1) 实现 实验 6. 2.5 中 BCD 码 向 二 进 制 码 转 换 的 电路 ; 
2) 修改 6.3.1 节 中 的 斐 波 纳 契 电路 ， 增 加 一 个 用 于 显示 越界 的 输出 信号; 
3) 设计 顶层 框图 和 主 控 FSM 状态 图 ; 
4) 设计 HDL 代码 ; 
5) 设计 测试 平台 并 用 于 仿真 验证 代码 的 运行 ; 
6) 综合 并 形成 电路 ， 在 FPGA 上 编程 下 载 ， 并 验证 FPGA 的 运行 。 


6.5.4 带 有 BCD LO 的 斐 波 纳 契 电 路 : 设计 方法 I 


另外 一 种 代替 实验 6. 5.3 中 的 “ 子 系统 方 案 ” 的 设计 方法 是 将 3 个 子 系统 
集成 为 一 个 系统 并 为 这 种 特定 的 应 用 设计 一 个 定制 的 FSMD。 这 一 方法 消除 了 控 
制 状态 机 的 管理 ， 并 为 这 3 种 任务 的 寄存 器 共享 提供 了 机 会 。 设 计 电路 过 程 如 
F: 

1) 使 用 一 个 FSMD 重新 设计 实验 6.5.3 的 电路 ， 设 计 方 应 去 除 所 有 多 余 的 
电路 和 状态 ， 例 如 各 种 各 样 的 done-tick 信号 和 done 状态 ， 同 时 拓展 机 会 用 于 共 
享 和 重用 不 同步 又 中 的 寄存 器 ; 

2) 设计 ASMD 图 ; 

3) 设计 基于 ASMD 图 的 代码 ; 

4) 设计 测试 平台 并 用 于 仿真 验证 代码 的 运行 ; 

5) 综合 电路 ， 并 下 载 至 目标 FPGA 芯片 中 ， 验 证 运行 ; 

6) 检查 综合 报告 并 比较 这 两 种 方式 的 LEs 的 利用 率 ; 

7) 计算 两 种 方式 完成 操作 所 需要 的 时 钟 周期 数 。 


6.5.5 尺度 自 适 应 的 低频 计数 器 


6. 3.5 节 中 的 低频 率 计数 器 的 操作 非常 受 限 。 输 入 信号 的 频率 范围 被 限制 在 
了 1 ~10Hz 之 间 。 当 超出 这 个 范围 时 它 将 失去 准确 性 。 回 忆 6. 3. 5 节 ， 频 率 计数 
器 的 精度 依赖 于 周期 计数 器 的 精度 ， 周 期 计数 器 计数 到 ms 级 tick。 我 们 可 以 修 
改 t 计 数 右 以 生成 一 个 ps 级 tick( 即 从 0~49 间 计 数 ) ， 将 精度 提高 1000 倍 。 这 
一 方法 可 以 使 频率 计数 器 计数 范围 增加 到 9999Hz， 仍 然 保持 至 少 4 位 精确 性 。 

对 于 低频 输入 来 说 使 用 一 个 из 级 的 tick 可 以 带 来 大 于 4 位 的 精度 ， 并 且 数 
值 必须 被 移 位 和 截断 以 便于 显示 在 七 段 LED 数码 管 上 。 一 个 尺度 自 适应 的 低频 
计数 器 会 自动 调整 运行 ,显示 最 左边 的 4 个 数 ， 同 时 在 合适 的 位 置 放置 十 进 制 小 
数 点 。 例 如 ， 根 据 不 同 的 范围 ， 频 率 测量 值 将 会 显示 为 “1.234”，“12.34”， 
“193.4” 或 者 “1234”。 ; 

这 种 自 适 应 范围 的 低频 率 计 数 器 需要 一 个 ВСЮ 码 调整 电 路 。 它 首先 检查 
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BCD 序列 最 重要 的 BCD 码 〈 也 就 是 4 个 最 高 有 效 位 ) 的 值 是 否 为 零 。 如 果 为 
零 ， 电 路 将 按 顺序 向 左 移动 BCD 位 置 并 且 对 十 进 制 分 数 进行 计数 。 这 种 操作 是 
反复 执行 的 ， 直 到 最 关键 的 BCD HATE “0000” 

完整 的 尺度 自 适应 低频 计数 器 可 以 按照 如 下 步骤 来 实现 : 

1) 使 用 ms 级 tick 修改 周期 计数 器 ; 

2) 扩展 二 进 制 码 到 BCD 码 转换 电路 的 数值 范围 ; 

3) 设计 BCD 码 调整 电路 和 代码 的 ASMD 图 ; 

4) 在 最 后 一 步 修改 控制 状态 机 ， 将 BCD 码 调整 包含 进去 ; 
5) 设计 一 个 简单 的 译 码 电路 ， 使 用 小 数 点 计数 器 的 输出 去 激活 七 段 LED 数 
码 管 显 示 期 望 的 小 数 点 ; 

6) 设计 测试 平台 并 且 通 过 仿真 来 验证 代码 功能 ; 

7) 综合 电路 ， 对 FPGA 芯片 进行 编程 并 验证 其 功能 。 


6.5.6 反应 定时 电路 


手眼 协调 性 是 指 双手 和 眼睛 协同 工作 完成 一 个 任务 时 的 能 力 。 一 个 反应 定时 
电路 用 于 测量 一 个 人 在 看 到 一 个 可 视 的 外 界 激励 的 时 候 做 出 反应 的 速度 。 这 种 电 

1) 电路 有 3 个 输入 按钮 ， 对 应 clear, start 和 stop 信号 ， 电 路 使 用 一 个 单一 
的 分 立 LED 作为 视觉 刺激 ， 并 在 七 段 LED 数码 管 上 显示 相关 信息 ; 

2) 使 用 者 通过 按 下 “clear” 按 钮 强制 使 电路 返回 初始 状态 ， 此 时 七 段 数码 
管 显 示 一 条 欢迎 信息 “HI”, 视觉 刺激 LED XB]; 

3) 当 准 备 就 绪 后 ， 使 用 者 将 按 下 “start” 按 钮 以 初始 化 为 测试 状态 ， 七 段 
数码 管 熄灭 ; 

4) 经 过 一 个 2 ~ 155 的 随机 时 间 间 隔 之 后 ， 视 觉 刺 激 LED 点 亮 ， 同 时 计时 
器 开始 向 上 计数 。 计 时 器 每 隔 1ms 加 1 并 且 它 的 值 将 以 “0.0000”s 的 形式 显示 
在 七 段 LED 数码 管 上 ; 

5) 当 视 觉 激 励 LED 灯亮 后 ， 使 用 者 应 尽 可 能 快 地 按 下 “stop” 按 钮 ， 一 旦 
停止 按钮 有 效 时 计时 器 将 停止 计数 ， 七 段 数码 管 将 显示 响应 时 间 ， 对 于 绝 大 多 数 
人 来 说 它 的 值 应 该 在 0. 15 ~0. 305 之 间 ; 

6) 如 果 没 有 按 下 “stop” 按 钮 ， 计 时 器 在 1s 后 停止 并 且 显 示 “1. 000”; 

7) 如 果 “stop” 按 钮 在 视觉 刺激 LED 点 亮 之 前 按 下 ， 电 路 将 停止 并 在 七 段 
数码 管 显 示 “9. 999”。 

设计 电路 步骤 如 下 : 

1) 设计 ASMD 图 ; 

2) 根据 ASMD 图 设计 HDL 代码 ; 
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3) 综合 电路 ， 对 FPGA 芯片 进行 编程 并 验证 其 功能 。 
6.5.7 巴 贝 奇 差 分 引擎 模拟 电路 


巴 贝 奇 差 分 引擎 是 一 个 对 多 项 式 函数 进行 列表 的 机 械 式 数字 计算 设备 。 由 巴 
比 奇 * 查尔斯 提出 ， 一 位 19 世纪 的 英国 数学 家 。 该 引擎 基于 牛顿 的 差分 计算 方 
法 从 而 避免 了 乘法 器 的 出 现 。 例 如 ， 考 查 一 个 二 阶 多 项 式 f(n) =2m +3n +5。 
我 们 可 以 得 到 f(n) 与 f(n - 1) 825: 

f(n) -f(n-1) =4n +1 
假设 为 整数 且 п>0ь„ f(r) 可 以 被 递归 定义 为 
如 果 n=l 


fn) = ‘ae 1) +4п+1 如 果 n»l 
这 个 过 程 可 以 用 4n + 1 表达 式 进 行 重复 。 设 g(n) =4n+1。 可 以 找到 g(n) 与 
8(n 一 1) 的 差 : 
g(n) -g(n -1) =4 


&(z) 可 以 被 递归 定义 为 
5 ШЖ n=0 
g =] аслу 44 如 果 n>l 

且 f(n) 可 以 被 重新 写 为 


5 如 果 n=0 
A 669 如 果 n>0 
需要 注意 的 是 ， 在 递归 定义 的 f(n) 和 g(n) 中 只 涉及 了 加 法 运算 。 
从 最 后 的 两 个 递归 等 式 的 定义 可 以 得 出 计算 f(n) 的 算法 。 需 要 两 个 临时 寄 
存 器 来 追踪 并 记录 最 近 计 算 所 得 的 f(n) 和 g(n) 的 值 ， 以 及 男 外 两 个 寄存 器 来 更 
新 f(n) 和 g(n)。 假设 n 是 一 个 6 位 的 输入 并 且 当 作 一 个 无 符号 整数 。 使 用 RT 
方法 学 设计 这 个 电路 : 
1) 设计 ASMD 图 ; 
2) 设计 基于 ASMD 图 的 HDL 代码 ; 
: 设计 测试 平台 并 且 通 过 仿真 验证 代码 功能 ; 
综合 合 源 代码 为 实际 电路 ， 对 FPGA 进行 编程 ， 验 证 FPGA 的 功能 ; 
假设 h(n) 2n! +2n +2п +1, 使 用 上 述 方法 得 出 h(n) 的 递归 表达 式 ( 注 
意 ， 对 于 一 个 三 次 多 项 式 来 说 需要 3 个 层次 的 递归 等 式 ) 。 重 复 步骤 1 ~4。 
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由 于 本 书 主要 关注 数字 设计 ， 因 此 ， 我 们 只 介绍 Verilog 语言 的 最 小 子 集 ， 
并 依赖 于 比较 简单 的 设计 原则 和 模版 。 在 这 一 章 ， 我 们 就 Verilog 语言 选择 了 一 
些 比较 重要 的 话题 进行 深入 的 讨论 。 除 了 上 一 部 分 对 仿真 相关 的 构建 方式 进行 了 
简 述 以 外 ， 这 些 话 题 都 与 综合 相关 ， 且 能 帮助 我 们 开发 更 加 复杂 的 代码 。 也 可 以 
跳 过 本 章 内 容 ， 不 会 对 其 他 章节 的 理解 产生 影响 。 


7.1 阻塞 和 非 阻塞 


在 always 结构 块 中 ， 有 两 种 赋值 方法 可 以 使 用 : 阻塞 赋值 和 非 阻 塞 赋值 。3 
个 简单 的 使 用 原则 在 前 面 的 章节 里 已 经 给 出 : 

e 将 电路 划分 为 寄存 器 电路 和 组 合 逻辑 电路 ; 

ө 为 寄存 器 电路 选择 一 个 合适 的 模版 ， 对 寄存 器 要 使 用 非 阻塞 赋值 ; 

e 使 用 阻塞 赋值 描述 组 合 逻辑 电路 。 

在 这 一 部 分 ， 本 书 将 分 析 这 两 种 赋值 方法 ， 并 解释 使 用 原则 背后 两 者 间 的 关 
系 ， 本 书 将 在 下 一 部 分 介绍 另外 一 种 可 选 的 代码 风格 。 


7.1.1 概述 


1. 阻塞 赋值 ”阻塞 赋值 的 基本 语法 为 
[变量 ] =[ 表 达 式 ] ; 

当 赋 值 语句 执行 时 ， 等 式 右边 的 表达 式 值 被 计算 出 来 ， 并 赋值 给 等 式 左边 的 
变量 ， 这 一 过 程 不 会 被 其 他 任何 语句 所 打 断 。 这 样 ， 它 “阻塞 ”了 其 他 语句 的 执 
行 ， 直 到 当前 的 赋值 过 程 执行 完毕 。 阻 塞 赋值 的 行为 与 C 语言 变量 赋值 相似 。 

2. 非 阻塞 赋值 ” 非 阻 塞 赋值 的 基本 语法 为 

[变量 ] «e [表达 式 ] ; 

非 阻塞 赋值 的 行为 更 加 微妙 ， 从 硬件 的 角度 去 解释 最 合适 不 过 了 。 回 想 一 
F, — always 块 可 被 看 作为 一 个 抽象 的 硬件 部 件 。 时 序 控制 结构 可 以 添加 到 
always 块 中 用 于 模拟 传播 延迟 。 对 于 我 们 的 可 综合 代码 ， 当 没有 显示 的 时 序 控制 
时 ， 会 存在 一 个 隐 式 的 假定 时 间 步 长 用 于 模拟 延迟 。 当 always 块 被 激活 时 ， 等 
式 右边 的 非 阻塞 表达 式 的 值 在 时 间 步 长 的 一 开始 便 被 计算 出 来 。 当 执行 到 always 
块 的 最 后 时 (即时 间 步 长 结束 时 ) ， 右 边 表达 式 的 值 赋值 给 等 式 左边 的 非 阻塞 赋 
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值 变量 。 由 于 其 他 语句 可 以 在 求 值 和 赋值 过 程 中 执行 ， 因 此 这 种 赋值 方式 被 称 为 
“ЧЕН 25” 


假设 变量 x 通过 非 阻塞 赋值 方式 被 赋值 。 然 而 ，Verilog 的 实际 调度 却 相当 复 


s， 非 阻塞 赋值 的 行为 可 以 被 解释 成 如 下 过 程 : 


e 在 always 块 的 起 始 ，x 被 赋值 给 х; 

ө xu 代替 等 式 左边 变量 x; 

ө xm 代替 等 式 右 边 变量 x; 

ө fE always АНЯ, х, КАНА х 

对 应 的 解释 可 参见 下 面 代码 中 的 注释 部 分 : 
always @ * 

begin// % cay = x 


y «x &-:e// y=x,,,, & *"* 
x € MeV 


end// x 2x, 
示例 :为 了 能 够 理解 阻塞 与 非 阻塞 赋值 间 的 区 别 , 让 我 们 思考 一 下 在 3.3.4 节 


讨论 过 的 3 个 输入 和 电路 。 相 应 代码 重复 放 在 示例 7. 1 中 。 代 码 中 使 用 的 是 阻塞 
赋值 ,推断 出 的 电路 如 图 3-3a 所 示 。 


示例 7.1 使 用 阻塞 赋值 的 与 门 


module and_block 


( 


input wire a, b, c, 
output reg y 
); 
always @ * 
begin 
Ya 
yay & b; 
y=y & c; 


end 


endmodule 


阻塞 赋值 的 行为 与 C 语言 的 顺序 语句 相似 ，y 变量 在 最 后 得 到 а, b. c 相 与 
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的 值 。 注 意 本 段 代码 只 是 出 于 展示 的 目的 。 使 用 顺序 语义 描述 硬件 是 非常 不 好 的 
设计 实践 。 
如 果 我 们 使 用 非 阻 塞 赋值 代替 阻塞 赋值 ， 修 改 后 的 代码 如 示例 7.2 所 示 。 注 
释 代 码 是 对 使 用 y 的 解释 。 
示例 7.2 与 门 -使 用 非 阻塞 赋值 


module and-nonblock 
( 
input waire a,b,c, 
output reg y 
); 
always @ x 
begin// у. =Y 
y <=a3// у =a 
y <=y & b;// уа =Y. Í & b 
y «sy &c;/Z yai =Уыу & e 
end// 了 =yem 


endmodule 


注意 ， 前 两 句 赋值 语句 没有 任何 作用 ， 与 下 面 代 码 相同 
always @ * 

y <=y & c; 

相应 的 电路 图 如 图 3-3b 所 示 ， 并 非 为 期 望 电路 。 


7.1.2 组 合 逻 辑 电路 


前 面 小 节 中 的 例子 是 个 极端 的 例子 。 除 了 默认 值 ， 绝 大 多 数组 合 逻辑 电路 代 
码 不 会 向 同一 变量 多 次 赋值 。 对 于 同样 的 电路 ， 阻 塞 赋值 和 非 阻塞 赋值 均 能 实现 
正确 描述 。 然 而 ， 它 们 之 间 还 是 存在 着 一 些 细微 的 差别 。 思 考 一 下 在 1. 2 节 讨 论 
的 1bit 相等 判断 电路 。 使 用 阻塞 赋值 修改 后 的 代码 如 示例 7. 3 所 示 。 我 们 在 敏感 
列表 中 显示 地 列 出 了 变量 。 
示例 7.3 使 用 阻塞 赋值 的 相等 判断 电路 


module eql block 
( 


input wire 10, il, 
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output reg eq 
ji 
reg p0, pl; 
always @ (10, il) // 敏感 列表 中 只 有 iD #lil 
// 请 句 的 顺序 非常 重要 
begin 
pO0O= ~i0 & ~il; 
pl =i0 & il; 
eq=p0 | pl; 
end 


endmodule 


注意 ， 敏 感 列表 中 只 包含 i0 和 这。 当 其 中 任何 一 个 发 生变 化 时 ，always Ж 
便 会 被 激活 。p0、pl 和 eq 被 顺序 计算 求 值 。ed 在 第 一 个 时 间 步 长 的 结束 被 更 
新 。 

语句 的 顺序 非常 重要 。 假 设 我 们 将 最 后 一 个 语句 挪 到 开始 位 置 : 

always @ (10, il) 

begin 

eq=p0 | pl; 
po = ~i10 & ~il; 
pl=i0 & il; 

end 
由 于 pO All pl 还 没有 被 赋予 新 值 ， 将 会 使 用 上 次 激活 产生 的 值 。 使 用 上 次 的 值 便 
推 其 出 了 锁 存 器 ， 因 此 这 段 代码 是 不 正确 的 。 

可 以 使 用 非 阻 塞 赋值 代替 阻塞 赋值 。 如 示例 7.4 所 示 。 赋 值 语句 的 解释 参见 
代码 的 注释 。 

示例 7.4 使 用 非 阻 塞 赋值 的 相等 判断 电路 


module eql non block 
( 
input wire 10, il, 
output reg eq 
); 
reg pO, pl; 
always @ (i0, il, pO, pl) //p0 , pl 也 在 敏感 列表 中 
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// 语句 的 顺序 不 重要 
begin // PO my =р0; PL ery = Pl; 
pO <= ~i0 & ~il; // рб „= ~i0 & ~il; 
pl <=i0 & 11; // pl,,, =i0 & il 
eq <=p0 | рі; //eqw =p0.,,]| PL entry 
end // eq = ед5 PO = PO ins pl = PL erin 
endmodule 


注意 pO 和 pl 均 在 敏感 列表 中 。 当 10 BK il 变化 时 ，always 块 被 激活 ， 新 值 
在 第 一 个 时 间 步 长 的 结束 被 赋值 给 pO 和 pl。 由 于 eq 基于 pl 和 pl 的 旧 值 ( 即 ， 
рб, and Pl ony)» ЖЖ eq 保持 不 变 。 当 当前 时 间 步 长 执行 结束 后 ，always 块 因 
为 p0 和 pl 的 变化 (由 于 pO 和 pl 在 敏感 列表 中 ) 再 次 被 激活 。ed 变量 在 第 二 个 
时 间 步 长 的 最 后 使 用 pO 和 pl 更 新 。 注 意 ， 改 变 这 些 语句 的 顺序 ， 结 果 是 一 样 
的 。 

虽然 这 两 种 代码 描述 的 是 同一 个 电路 ， 但 使 用 非 阻 塞 赋值 会 消耗 更 多 的 仿真 
时 间 。 因 此 ， 推 荐 使 用 阻塞 赋值 来 描述 组 合 逻辑 。 


7.1.3 存储 元 件 


在 4.2 节 中 的 存储 元 件 模 版 中 ， 非 阻塞 赋值 被 用 于 推断 存储 器 。 例 如 ， 一 个 
D 触发 器 的 代码 : 
always@ ( posedge clk ) 
q <=d; 
使 用 阻塞 赋值 来 推断 出 一 个 存储 器 也 是 可 能 的 。 例 如 : 
always@ (posedge clk) 
q-d; 
虽然 对 于 一 个 单独 的 触发 器 ， 上 面 的 代码 能 正常 工作 。 但 多 个 寄存 器 相互 作 
用 时 ， 就 会 导致 一 些微 妙 的 问题 出 现 。 
考虑 两 个 寄存 器 每 个 时 钟 都 交换 数据 。 当 使 用 阻塞 赋值 ， 代 码 变 为 
always@ ( posedge clk ) 
a=b; 
always@ ( posedge clk ) 
b=a; 
在 clk B EF, PAS always 块 同时 被 激活 和 运行 。 这 两 个 操作 应 在 一 个 时 
间 步 长 内 完成 。 根 据 Verilog 标准 ， 两 个 always 块 的 执行 可 以 按 任意 顺序 调度 。 
如 果 先 执行 第 一 个 always 块 ， 由 于 阻塞 赋值 ，a 变量 会 马上 得 到 b 变量 的 值 。 当 
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第 二 个 always 块 执行 时 ,4b 变量 得 到 了 а 变量 更 新 后 的 值 ， 即 4 的 原 值 ， 因 此 6 
变量 不 变 。 同 理 ， 如 果 第 二 个 always 块 先 被 执行 ，a 得 到 其 原 值 。 这 就 是 Verilog 
中 的 “ 竞 态 条 件 ”。 如 果 单 从 Verilog 语言 的 角度 看 ， 这 两 种 值 都 是 合法 的 。 

现在 ， 我 们 使 用 非 阻塞 赋值 修改 上 述 代 码 (由 于 需要 注释 ， 因 此 增加 了 begin 
和 end 分 隔 符 ) : 

always? ( posedge clk ) 


begin // bony = 
a <= b; // аы = ө 
end //a 2 a, 
always ( posedge clk ) 
begin IT a, =a 
b «-a; / / b ai = Ventey 
end bsb a 


非 阻塞 赋值 解释 详 见 注释 。 由 于 在 赋值 过 程 中 使 用 原始 的 人 口 值 ， 因 此 无 论 
执行 顺序 如 何 ，a т 均 会 得 到 正确 的 值 。 

由 于 非 阻塞 赋值 是 对 期 望 的 行为 建 模 ， 且 避免 了 竞争 条 件 ，4. 2 节 所 示 的 模 
板 一 直 使 用 非 阻 塞 赋值 来 推断 触发 器 和 寄存 器 。 


7.1.4 时 序 电 路 使 用 阻塞 和 非 阻塞 赋值 


在 4.2 节 讨 论 的 存储 元 件 的 模版 都 是 最 简单 的 时 序 电路 代码 。 可 以 将 多 个 赋 
值 ， 包 括 阻塞 和 非 阻 塞 赋值 放 于 同一 个 always 块 中 。 我 们 用 一 个 简单 的 例子 解 
释 不 同 组 合 的 行为 ， 近 而 更 好 地 理解 这 两 种 赋值 。 

思考 图 7-1b 所 示 电 路 。 它 将 a 和 “进行 与 操作 后 ， 在 时 钟 上 升 沿 将 结果 存 
人 一 个 D 触发 器 中 。 基 于 我 们 之 前 的 方法 ， 我 们 可 以 将 存储 和 组 合 电 逻 辑 电路 
分 离 ， 得 到 两 段 代 码 ， 如 示例 7.5 所 示 。 














> clk 
90 d 49 d 9[—91 
[> clk D clk 





b) c) 


图 7-1 混合 赋值 推断 出 的 电路 
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示例 7.5 两 段 式 实现 


module ab ff 2seg 
( 
input wire clk, 
input wire a, b, 
output reg q 
); 
reg q_next; 
//D fob Be at 
always @ ( posedge clk) 
q «-q. next; 
// f trie dH 
always @ * 
q_next =a & b; 
endmodule 


另外 ， 我 们 可 能 将 两 段 合 并 在 一 个 always 块 中 描述 电路 。 示 例 7.6 ЈН ГЇН 
塞 和 非 阻 塞 的 6 种 不 同 组 合 赋值 代码 。 
示例 7.6 混合 分 配 例子 


module ab ff all 

( 
input wire clk, 
input wire a, b, 


output reg q0, ql, q2, q3, q4, q5 


reg ab0, abl, ab2, ab3, ab4, abS; 
// attempt 0 
always @ ( posedge clk) 
begin 
ab0 =a & b; 
q0 «- ab0; 
end 


// attempt 1 
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always @ ( posedge clk) 


begin // ADL ay, -abl; ql entry «ql ; 
abl «za & b; // abl =a & b 
ql <=abl; // ql, = abl oy 
end // abl abl; ql =ql oi 
// attempt 2 
always @ ( posedge clk) 
begin 
ab2 =a & b; 
q2 =ab2; 
end 


// attempt 3 (ZEH attemptO. 语句 顺序 ) 
always @ (posedge clk) 
begin 

q3 <= ab3; 

ab3 =a & b; 
end 
// attempt 4 (交换 attemptl 语句 顺序 ) 
always @ ( posedge clk) 


begin // abd, , =ab4; 94. - 94; 
q4 <= ab4; // qd oxy = abd 
abd <=а & b; // abd, =a & b 

end // ab4 = ab4 3 q4 = q4 iy 


// attempt 5 (交换 attempt 2 语句 顺序 ) 
always @ ( posedge clk) 
begin 
q5 =ab5; 
ab5 =a & b; 
end 
endmodule 


fr attemp 0 中 , ab0 和 q0 的 赋值 最 初 推断 出 了 两 个 寄存 器 ， 一 个 用 于 寄存 
ab0， 男 一 个 用 于 寄存 90。 由 于 ab0 通过 阻塞 赋值 立即 被 更 新 ，g0 得 到 a & b f 
值 。 相 应 电路 电路 图 如 图 7-1a 所 示 。 由 于 ab0 没有 在 always 块 外 使 用 ， 对 于 ab0 
的 寄存 便 没有 必要 ， 因 此 相应 的 寄存 器 便 可 以 被 移 除 。 最 终 ， 电 路 如 图 7-1b 所 
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示 ， 这 正 是 我 们 期 望 的 电路 。 

在 attemp 1 P, Xf abl 的 赋值 使 用 了 非 阻塞 赋值 。 相 应 解释 见 注释 。 注 意 ， 
ql 得 到 abl oy, MAE abl oro а, Æ abl 之 前 存储 的 值 和 相应 的 寄存 输出 。 
相应 的 电路 如 图 7-1e 所 示 。 推 斯 出 了 一 个 非 预期 的 输入 buffer, a & b 的 存储 值 
被 延迟 了 一 个 时 钟 周 期 。 

在 attemp 2 中 ， 阻 塞 赋值 被 应 用 到 ab2 和 2。 推断 出 的 电路 与 attemp 0 相 
同 ， 如 图 7-la 和 图 7-1b 所 示 。 由 于 使 用 阻塞 赋值 来 推断 触发 器 可 能 导致 7.1.3 
节 讨 论 的 竞争 条 件 ， 因 此 ， 这 种 代码 风格 是 不 推荐 的 。 

,为 了 便于 示范 ， 让 我 们 检验 当 转 换 attempts0 1, 2 的 赋值 顺序 会 发 生 什 么 。 
转换 后 的 代码 如 attempts 3, 4 和 5 所 示 。 在 attemp3 rB, ab3 在 对 其 更 新 赋值 之 
前 被 使 用 ， 这 样 ，g3 得 到 了 上 一 次 激活 时 的 旧 值 。 这 个 值 被 存储 于 寄存 器 中 ， 
也 就 是 寄存 的 а &b。 推 断 的 电路 对 应 图 7-1c。 在 attempt4 中 ， 切 换 顺 序 对 代码 功 
能 没有 影响 ， 具 体 解 释 详 见 代 码 中 的 注释 。 它 与 attempl 相同 。 在 attemp5 中 ， 
ab5 在 赋予 新 值 之 前 被 使 用 ， 这 样 ，g5 得 到 了 a & 寄存 后 的 值 。 推 断 出 的 电 旷 
与 attempt3 相同 。 

总 之 ， 只 有 attemp0 中 的 代码 正确 和 可 靠 地 描述 了 期 望 的 电路 。 


7.2 另外 一 种 时 序 电 路 代码 风格 


我 们 的 时 序 代码 模版 遵循 了 图 4-2 所 示 的 块 图 ， 它 将 寄存 器 分 为 一 个 单独 的 
代码 片段 。 当 理解 了 阻塞 和 非 阻塞 赋值 后 ， 我 们 可 以 将 寄存 器 和 ”next - state" Z 
辑 放 到 同一 个 always 块 中 。 这 种 代码 风格 更 紧凑 。 代 码 应 遵循 7.1.4 节 的 at- 
templ 片段 : 

e 使 用 阻塞 赋值 获取 “next - state” 逻辑 的 中 间 结 果 ， 这 些 赋值 语句 应 以 正确 
的 顺序 安排 ; 

e 使 用 非 阻塞 赋值 将 中 间 结 果 赋 值 给 寄存 器 。 

在 下 面 几 节 ， 我 们 用 几 个 例子 来 说 明 这 种 风格 。 


7.2.1 二 进 制 计数 器 


自由 运行 的 计数 器 已 经 在 4.3.2 节 讨 论 过 了 。 我 们 可 以 修改 示例 4.9 的 代 
码 ， 将 next - state 逻辑 和 寄存 器 合并 在 一 起 ， 如 示例 7.7 所 示 。 
示例 7.7 将 次 态 逻 辑 和 寄存 器 合并 的 自由 运行 计数 器 


module bin_counter_merge 


# (parameter N 28) 
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input wire clk, reset, 
output wire max tick, 
output wire[ N 21: 0] q 
js 
// 信号 声明 
regi N - 1; 0] r next, г reg; 
// ВЖ 
// BAP dS II next. state "2718 
always @ ( posedge clk, posedge reset) 
if( reset) 
rreg «20; ZZ ÍN [1b '0]] 
else 
begin 
// ARE HH 
r next zr reg +1; 
// ETE 
r reg <= г next; 
end 
Е 
assign q = г reg; 
assign max tick = (т тев = =2 ж *N-1) ?1'Ы; 1'b0; 


endmodule 


注意 输出 逻辑 的 描述 : 

assign max tick = (тг reg= =2 ж *N-1) ? 1°bl; 1'b0; 
必须 在 always 块 外 ， 如 果 放 在 块 内 ， 会 为 max_tick 推断 出 一 个 额外 的 触发 器 ， 
并 引入 一 个 时 钟 周 期 的 延 时 。 

由 于 r_next 没有 在 其 他 场合 使 用 ， 我 们 可 以 将 两 个 语句 合并 : 

г next zr reg +1; 

r reg «-r next; 

变 为 

r reg «-r reg +l; 


H q (UF r reg 后 ， 代 码 会 更 加 简洁 ， 如 示例 7.8 所 示 。 
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示例 7.8 使 用 紧凑 代码 实现 的 自由 运行 二 进 制 计数 器 


module bin_counter_terse 
# ( parameter N =8) 
( 
input wire clk, reset, 
output wire max – tick, 
output reg [N -1: 0] q 
) 
// 程序 体 
always @ ( posedge clk, posedge reset) 
if ( reset ) 
q«-0; 
else 
9<=9+1; 
// Bm dH 
assign max tick = (q= =2ж *N-1) ?1’bl : 1' b0; 


endmodule 


在 这 段 代 码 中 ， 等 式 右边 的 q 是 寄存 器 的 输出 ， 等 式 左边 的 q 是 更 新 值 ， 它 
在 下 一 个 时 钟 上 升 沿 存 储 到 寄存 器 中 。 
示例 4. 10 中 列 出 的 通用 二 进 制 计数 器 可 以 用 同样 的 方法 修改 ， 代 码 如 示例 
7.9 所 示 。 
示例 7.9 合并 寄存 器 和 次 态 逻 辑 的 通用 二 进 制 计数 器 


module univ_bin_counter_merged 

# (parameter N =8) 

( 
input wire clk, reset, 
input wire syn clr, load, en, up, 
input wire [N -1; 0] d, 
output wire max tick, min tick, 
output reg [N-1:0] q 

); 

// 程序 体 

// B46 a8 IK SE IB 
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always @ ( posedge clk, posedge reset) 
if (reset ) 
q<=0;// 
else if (syn_clr) 
q <=0; 
else if (load) 
q <= 4; 
else if (en & up) 
q<=q+1; 
else if (en & — up) 
q<=q - 1; 
// 由 于 q <=q AKH, АШАН 
// fiiia HE 
assign max tick = (q= =2 ж *«N-1) ? 1’bl : 1" b0; 
assign min tick = (q = =0) ? 1'bl; 1'b0; 
endmodule 


注意 最 后 的 else 分 支 被 省 略 掉 了 ， 它 暗含 q 保持 其 之 前 的 值 ， 即 
这 正 是 期 望 的 行为 。 


7.2.2 FSM 


有 限 状 态 机 中 的 状态 寄存 器 和 次 态 逻 辑 也 可 以 按 类 似 的 方法 合并 。 例 如 ， 思 
考 示例 5. 1 中 的 状态 机 。 修 改 后 的 代码 如 示例 7. 10 所 示 。 
示例 7. 10 寄存 器 与 次 态 逻 辑 合 并 的 有 限 状 态 机 


module fsm_eg_merged 
( 
input wire clk, reset, 
input wire a, b, 
output wire yO, yl 
у 
// 状态 符号 声明 
parameter [1: 0] sO =2'b00, 
sl 22*'b0l, 
s2 =2 bl0; 
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// 信号 声明 
reg [1: 0] state reg; 
// ARAS BE л AUK S E 
always @ ( posedge clk, posedge reset) 
if ( reset) 
state reg <= 80; 
else 
case (state reg) 
s0; if (a) 
if (b) 
state reg <= 52; 
else 
state reg <=sl; 
else 
state reg <= 80; 
sl: if (a) 
state reg <=s0; 
else 
state reg <= 51; 
82: state reg <=s0; 
default; state reg <=s0; 
endcase 
// Moore $i H #4 
assign yl = (state reg = =s0) | | (state reg- -sl); 
// Mealy fij ih i£ 4H 
assign yO = (state reg = =s0) & a & b; 
endmodule 


由 于 输出 未 寄存 ， 因 此 ， 相 应 语句 必须 置 于 always 块 外 。 


7.2.3 FSMD 


该 方法 也 可 应 用 于 FSMD。 思 考 示例 6.5 中 的 除法 FSMD 例子 。 修 改 后 的 代 
人 码 见 示例 7. 11。 
示例 7. 11 状态 寄存 器 和 组 合 逻 辑 合并 的 除法 FSMD 





module div_combined 
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#( 
parameter W =8, 


СВІТ =4 //CBIT =log2 (W ) +1 


input wire clk, reset, 
input wire start, 
input wire [W -1: O]dvsr, dvnd, 
output wire ready, done_tick, 
output wire № -1; 0] quo, тта 
); 
// 状态 符号 声明 
localparam [1; 0] 
idle =2’ b00, 
op =2’ b01, 
last =2’ b10, 
done =2’ bll; 
// 信号 声明 
reg [1: 0] state reg; 
reg [W —1: 0] rh reg, rl reg, rh tmp, d reg; 
reg [СВІТ -1: 0] n reg, n next; 
reg q bit; 
// fsmd 25 f£ di HII 25 12 HE 
always @ ( posedge clk, posedge reset) 


begin 
if (reset) 
begin 
state reg <= idle; 
rh_reg <=0; 
rl_reg <=0; 
d_reg <=0; 
n_reg <=0; 
end 
else 


begin 
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// 数据 路 径 功能 单元 
// А РЗК РЕЈ 


// 比较 和 减法 电路 
if (rh_reg > =d_reg) 
begin 
rh tmp =rh_reg — d reg; 
q bit =1’bl $ 
end 
else 
begin 
rh tmp = rh reg; 
q bit 2 1' b0; 
end 
// SS HB 


n next -n reg — 1; 


case (state reg) 
idle: 
begin 
if (start) 
begin 
rh_reg <=0; 
rl reg <=dvnd; // 2X ER 2 
d reg <= дуг — // Ж 
nreg <= СВІТ; // K/h 
state reg <= ор; 
end 
end 
op: 
begin 
//rh 和 rl 左 移 
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rl reg <= |rl reg[ W-2: 0], аЬ}; 
rh reg <= |rh tmp[ W -2; 0], rl reg[ W -1]] ; 
// 减 小 过 引伸 
n_reg <=n_next; 
if (n next = =1) 
state reg <= last; 
end 
last: // 最 后 一 次 重复 
begin 
rl reg <= (ті тев W -2: 0], q bit] ; 
rh reg <= rh tmp; 
state reg <= done; 
end 
done: 
state reg «- idle; 
default: state reg <= idle; 
endcase 
end 
end 
// 输出 
assign quo = rl_reg; 
assign гта = rh reg; 
// ARR AE GL 
assign ready = (state reg = = idle) ; 
assign done tick = (state reg = = done) ; 


endmodule 


这 段 代 码 更 加 复杂 ， 并 包含 了 一 段 数据 路 径 功能 的 单元 ， 用 于 产生 中 间 结 
果 。 注 意 , 一 些 中 间 变 量 ， 如 n_next， 被 用 于 后 面 的 许多 地 方 。 


7.2.4 BE 
总 之 ， 将 次 态 逻 辑 和 寄存 器 放 于 一 段 always 块 中 是 可 能 的 。 这 种 代码 风格 


更 紧凑 ， 使 用 的 变量 更 少 。 然 而 ， 必 须 小 心 编 码 ， 避 免 产 生 其 他 多 余 的 寄存 
[M 
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7.3 使 用 有 符号 数据 类 型 


7.3.1 概述 


根据 应 用 的 特点 ， 可 以 在 数字 系统 中 使 用 由 0 和 正 数组 成 的 无 符号 整数 ， 或 
者 由 0 以 及 正 数 和 负数 组 成 的 有 符号 整数 。 但 在 一 个 复杂 的 系统 中 ， 可 能 同时 需 
要 这 两 种 数据 类 型 。 

有 符号 整数 通常 由 二 进 制 补 码 格式 表示 。 图 7-2 所 示 为 一 个 4 位 的 二进制 
码 盘 " ， 里 面 罗 列 了 二 进 制 码 以 及 对 应 的 无 符号 和 有 符号 字 。 仔 细 观 察 会 发 现 这 
两 类 数字 的 加 法 和 减法 操作 是 相同 的 ， 加 减 一 个 正 数 的 结果 分 别 对 应 着 向 顺 时 针 
和 逆 时 针 的 移动 。 例 如 ,“1001”+ *0100" ERZ M“ 1001" 位 置 顺 时 针 移动 4 个 
位 置 ， 结 果 便 是 “1101”。 在 无 符号 整 型 格式 中 ， 翻 译 为 ( +9) +(+4) = +13, 
在 有 符号 整 型 格式 中 ， 翻 译 为 ( T7) + ( +4) = -3。 加 法 的 游 出 对 应 着 移动 过 码 
盘 的 “ 国 值 "。 注 意 ， 无 符号 和 有 符号 数 的 闵 值 是 不 一 样 的 。 无 符号 数 的 立 值 在 


“1 11 1” 和 “0000" 之 间 ， 而 有 符号 数 的 立 值 在 “01 1 1” 和 “1000" 之 间 。 
无 符号 格式 溢出 闹 什 





有 符号 格式 溢出 阔 值 
图 7-2 Abit 二 进 制 码 盘 
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物理 上 的 加 减法 行为 就 像 是 二 进 制 码 盘 的 移动 。 同 样 的 电路 可 适用 于 有 符号 
和 无 符号 格式 的 运算 ， 只 要 所 有 的 操作 数 和 结果 的 比特 位 数 相同 。 例 如 ， 设 a, 
b 和 sum 为 3 个 8bit 信号 。 语 句 : 
sum =a +b; 
便 会 推断 出 同样 的 硬件 电路 ， 并 使 用 同样 的 二 进 制 表示 ， 无 论 信号 是 否 被 当成 无 
符号 数 还 是 有 符号 数 。 这 一 定理 在 其 他 算法 操作 中 同样 是 正确 的 (遗憾 的 是 , 无 
法 用 于 非 算 法 操作 中 ， 如 关系 操作 或 溢出 状态 产生 )。 
另外 ， 当 操作 数 或 结果 的 位 宽 不 同时 ,需要 区 分 格式 。 这 是 因为 在 位 宽 扩展 
上 需求 不 同 。 对 于 无 符号 格式 ， 高 位 填充 0， 即 “0 PR”, 但 对 于 有 符号 格式 ， 
高 位 扩展 的 是 符号 位 ， 即 “符号 扩展 ”。 例 如 ，-5 H 4bit 表示 为 “1011”， 当 扩 
展 到 8bit 时 ， 变 为 “1111 -1011”， 而 非 “0000 - 1011", 
例如 ， a Fil sum 为 8 位 有 符号 数 ， b 为 4 位 有 符号 数 ， bb;b,b,, 语句 : 
sum =a +b; 
需要 把 b 扩展 到 8 位 。 在 无 符号 格式 中 ， 扩 展 后 的 b 为 0000bsb:b, bu， 而 在 有 符 
号 格式 中 ， 扩 展 后 的 b 为 bbbsbsbsbsbzbbo。 语 名 所 推断 出 的 硬件 包含 位 扩展 电 
路 和 一 个 加 法 器 。 由 于 扩展 电路 对 于 有 符号 和 无 符号 格式 有 所 有 同 ， 因 此 ， 对 于 
有 符号 和 无 符号 格式 ， 语 句 会 推荐 出 不 同 的 电路 实现 。 


7.3.2 Verilog – 1995 中 的 有 符号 数 


在 Verilog - 1995 中 ， 只 有 integer 数据 类 型 可 以 被 当 作 有 符号 数 ，reg 和 wire 
数据 类 型 会 被 当 作 无 符号 数字 。 由 于 integer 数据 类 型 位 宽 固定 (通常 是 32 位 )， 
因此 使 用 上 并 不 灵活 。 为 了 实现 有 符号 操作 ， 和 常常 需要 手动 编码 。 如 下 的 代码 片 
段 说 明了 有 符号 和 无 符号 操作 。 

reg[7: 0] a, b; 

reg[ 3: 0] c; 

reg[ 7; 0] suml, sum2, sum3, sum4; 

// 相同 位 宽 ， 可 用 于 有 符号 和 无 符号 操作 

suml =a +b; 

// 自动 扩展 0 

sum2 =a +c; 

// 手动 扩展 0 

sum3 =a+|14|1’b0|, cl; 

// 手动 符号 扩展 

sum4 =a + |4|1c[3]] , с}; 

第 一 句 中 的 a、b 和 suml 位 宽 相 同 ， 这 样 ， 无 论 它们 被 当 作 有 符号 数 还 是 无 
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符号 数 ， 推 断 出 的 电路 是 一 样 的 。 

第 二 句 中 的 。 位 宽 只 有 4bit。 要 根据 3. 2. 8 节 讨 论 的 规则 调整 它 的 位 宽 。 由 
T reg 类 型 是 能 被 用 作 无 符号 数 ， 因 此 会 采用 0 DR, ТЕ c 的 前 面 添 加 4 个 0。 

在 第 三 句 中 ， 我 们 手动 将 4 个 0 添加 到 c 的 前 面 ， 达 到 了 与 前 面 语句 相同 的 
效果 。 

在 第 四 句 中 ,我 们 将 变量 当 作 有 符号 数 。 为 了 实现 期 望 的 行为 ， 必 须 通过 符 
号 扩展 将 c 扩展 到 8 位 。 只 能 通过 人 手 编码 完成 , 将 c 的 MSB 复制 4 次 ( 即 41e 
[3] ) 来 生成 符号 扩展 的 bit 数 。 


7.3.3 Verilog -2001 中 的 有 符号 数 


在 Verilog -2001 中 ，reg 和 wire 数据 类 型 可 以 通过 在 声明 中 使 用 signed 关键 
字 扩 展 为 有 符号 格式 ， 如 下 所 示 : 
reg signed [7: 0] a, b; 
使 用 有 符号 数据 类 型 ， 之 前 的 代码 片段 可 修改 为 
reg signed [7: 0] a, b; 
reg signed [3: 0] c; 
reg signed [7: 0] suml sum4; 


// НІА Ж, АН PATE SITES BRE 

suml =a +b; 

// 自动 符号 扩展 

sum4 =a+c; 
H Ta, b 和 sum 位 宽 相等 ， 因 此 第 一 句 推断 出 一 个 常规 的 加 法 器 ，signed 数据 
类 型 只 是 帮助 我 们 要 关注 对 于 二 进 制 表 示 的 翻译 。 

第 二 句 中 表达 式 左 侧 的 所 有 变量 都 是 signed 数据 类 型 ， 且 e 会 通过 符号 扩展 
自动 扩展 至 8 位 。 这 样 ， 我 们 便 无 需 对 变量 进行 手动 填充 。 

在 小 规模 数字 系统 中 ， 通 常 只 使 用 无 符号 或 有 符号 格式 中 的 一 种 。 然 而 ， 在 
较 大 的 系统 设计 中 ， 可 能 包含 不 同 格式 的 子 系统 。Verilog 是 一 种 类 型 比较 宽松 
的 语言 ， 无 符号 和 有 符号 变量 可 以 在 同一 表达 式 中 混合 使 用 。 根 据 Verilog 标准 ， 
只 有 当 表 达 式 右边 的 所 有 变量 均 为 有 符号 数 ， 才 会 进行 符号 位 扩展 。 否 则 ， 所 有 
的 变量 都 会 进行 0 扩展。 思考 如 下 代码 片段 : 

reg signed [7: 0] a, sum; 

reg signed [3: 0]b; 

reg [3: 0] c; 
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sum =a +b +c; 
H T c 没有 使 用 signed 数据 类 型 ， 因 此 ， 表 达 式 右 侧 的 变量 b All 都 是 0 扩展 。 

Verilog 提供 了 两 个 系统 函数 ，$ signed( )# $ unsigned( ) ， 用 于 将 括号 内 
的 表示 转换 为 signed 和 unsigned 数据 类 型 。 例 如 ， 可 以 用 下 面 的 语句 转换 c 的 数 
据 类 型 ; 

sum =a +b + $ signed(c) ; 

现在 ， 表 达 式 右 侧 所 有 3 个 变量 均 为 signed 数据 类 型 ， 这 样 с 就 是 符号 扩展 
Te 

将 signed 和 unsigned 数据 类 型 混合 在 一 个 复杂 的 表达 式 中 易 引 入 一 些微 妙 的 
错误 ， 因 此 应 避免 这 种 使 用 。 如 果真 是 必须 要 这 样 做 ， 那么 表达 式 应 保持 简洁 ， 
且 应 使 用 转换 函数 ， 以 确保 数据 类 型 的 一 致 性 。 


7.4 在 综合 中 使 用 函数 


7.4.1 概述 


在 Verilog 的 module 中 ， 一 些 表 达 式 可 能 出 现在 许多 地 方 。 共 同 使 用 的 部 分 
应 当 被 提取 到 一 个 例 行 程序 中 ， 而 不 是 重复 进行 编码 。 可 以 通过 在 module 中 定 
义 一 个 函数 实现 。Verilog 的 函数 可 以 带 有 一 个 或 多 个 输入 参数 ， 并 返回 一 个 单 
一 值 。 在 综合 过 程 中 ， 函 数 被 展开 和 "” 打 散 ”， 并 映射 到 硬件 中 。 这 样 ， 为 了 综 
合 起 见 ， 对 于 复杂 的 表达 式 ， 函 数 应 保持 简明 ， 并 可 作为 速记 使 用 。 函 数 的 基本 
语法 为 


module 


// REX Е module 内 
function [ result type] [func id] ([ input arg]) ; 
begin 
[ statements | ; 
end 


endfunction 


endmodule 

函数 体 定义 在 function 和 endfunction 分 隔 符 内 。 可 选项 [result-type] 用 于 指 
定 返回 结果 的 数据 类 型 ， 通 常 是 带 有 位 宽 定义 的 reg 或 integer。 输 入 参数 声明 在 
[input-arg ] 中 ， 函 数 的 名 字 通 过 [func-id] 指定。 函数 体 通 过 语句 描述 ， 结 果 通 过 
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如 下 的 语句 返回 : 


[ func_id] =---; 


7.4.2 举例 


回顾 示例 6. 6 所 示 的 二 进 制 到 ВСЮ 码 的 转换 电路 。 在 转换 过 程 中 ， 需 要 对 


每 个 BCD 数字 用 特定 的 方式 加 一 个 值 。 为 了 让 FSMD 部 分 代码 更 加 清楚 ， 我 们 
在 代码 中 用 分 离 的 片段 说 明 : 


= 


module. . . 


assign bed0_tmp = (bedO0 reg > 4) ? bedO reg +3 : bedO_reg; 
assign bedl tmp = (bedl reg > 4) ? bedl reg +3 : bcedl reg; 
assign bed2 tmp = (bed2 reg > 4) ? bed2 reg +3 : bcd2 reg; 
assign bed3. tmp = (bed3_reg > 4) ? bed3 reg +3 : bcd3 reg; 


endmodule 

我 们 定义 一 个 函数 ba( ) 来 代替 重复 编码 四 次 同样 的 表达 式 来 实现 相同 的 目 
修改 后 的 代码 片段 成 为 了 : 

module. . . 

assign bcd0_tmp = ba( bed0_reg) ; 

assign bedl tmp = ba( bedl reg) ; 

assign bed2_tmp = ba( bed2 reg) ; 

assign bed3 tmp = ba( bed3 reg) ; 


// PARCEL (ba : bed adjust ) 
function [3: 1] ba ( reg [3: O] bed in); 
begin 

ba = (bed. in > 4) ? bed in +3 : bed in; 
end 


endfunction 


endmodule 


函数 ba( ) (用 于 BCD 转换 ) 在 最 后 被 定义 。 函 数 使 用 了 一 个 Abit 的 参数 ， 并 


返回 一 个 4bit 的 结果 。 可 以 使 用 此 函数 替换 之 前 的 表达 式 。 事 实 上 ， 可 以 使 用 函 
Ў be( bed reg) 直接 代替 bed0_tmp， 将 这 些 变 量 从 代码 中 去 除 。 


另外 一 个 常用 的 函数 是 用 于 计算 依赖 其 他 参数 的 常数 。 回 顾 在 示例 4. 11 中 
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讨论 的 模 m 计数 器 。 有 两 个 参数 : 用 于 指定 m 值 的 M， 以 及 用 于 指定 计数 器 中 
位 宽 的 参数 N. N 的 值 为 [log,M] ， 且 不 应 是 一 个 独立 的 参数 。 一 个 更 好 的 方法 
是 指定 N 作为 一 个 局 部 参数 ， 并 在 module 内 部 计算 它 的 值 。 可 以 通过 函数 实现 。 
修改 后 的 代码 如 示例 7. 12 所 示 。 

示例 7. 12 使 用 函数 的 模 m 计数 器 


module mod. m counter. fc 

#( parameter M 210) // mod-M 
( 

input wire clk, reset, 

output wire max tick, 

output wire [log2( M) -1: 0] q 
1% 
// 信号 声明 

localparam N =log2(M); //М {А1777 
reg [N-1: 0] r reg; 
wire [N -1; 0] r next; 
// Ж 
// BAF tt 
always € ( posedge clk, posedge reset) 
if (reset ) 
r reg <=0; 
else 
r reg «-r next; 

// WASTER 
assign r next = (r_reg= =(M-1)) ?0 :r тев +1; 
// 输出 逻辑 
assign q = r_reg; 
assign max tick = (r_reg= -(M-1)) ?1’bl ; 1'b0; 
//log2 K% 


function integer log2 (input integer п); 


integer i; 
begin 
log2 21; 


for (120; 2* жї < п; і=1+1) 
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log2 =1+1; 
епі 
endíunction 


endmodule 


可 计算 [log, (х) ] 的 函数 log2( ) 被 定义 在 module 内 ， 用 于 获取 局 部 参数 N， 
由 于 运算 是 在 代码 被 细 化 时 执行 的 ， 因 此 在 综合 前 数值 就 已 经 确定 了 ， 且 不 会 有 
任何 物理 电路 被 该 函数 推断 出 。 


7.5 用 于 测试 平台 开发 的 额外 结构 


由 于 本 书 主要 关注 于 硬件 的 开发 ， 因 此 我 们 只 对 一 小 部 分 可 综合 的 Verilog 
子 集 进 行 了 检验 ， 在 验证 上 ， 也 只 使 用 了 两 种 基本 的 测试 平台 模板 。 虽 然 详细 履 
六 Verilog 语言 和 测试 平台 的 内 容 已 经 超出 了 本 书 的 要 求 ， 但 在 这 一 他， 会 对 一 
些 语言 结构 提供 一 个 简明 的 概述 ， 以 帮助 我 们 开发 更 加 复杂 的 测试 平台 。 

不 像 可 综合 代码 ， 测 试 平台 代码 会 被 送 到 仿真 器 中， 并 在 一 个 主机 中 执行 。 
可 以 在 代码 中 包含 复杂 的 语言 结构 和 顺序 执行 的 算法 。 许 多 Verilog 结构 与 C 语 
言 中 的 很 相似 ， 并 可 以 用 相似 的 方式 使 用 。 


7.5.1 always 和 initial 块 


Verilog 有 两 种 类 型 的 过 程 性 代码 块 : always 和 initial。 一 个 always 块 里 包含 
了 程序 语句 并 建 模 了 一 个 抽象 电路 部 件 。 我 们 已 经 在 3. 3 节 中 对 一 种 特定 类 型 的 
always 块 进行 了 检验 。 它 是 用 于 综合 的 。 块 里 有 人 敏感 列表 ， 但 没有 包含 其 他 明显 
的 时 序 控制 结构 。always 块 的 激活 和 执行 通过 敏感 列表 指定 的 事件 触发 。 
若 出 于 建 模 的 目的 ，always 块 便 可 以 包含 时 序 结构 ， 以 指定 不 同 结构 的 相应 
的 延 时 或 等 待 特定 的 事件 。 有 时 敏感 列表 可 以 省 略 。 例 如 ， 可 以 使 用 下 列 代码 片 
段 对 时 钟 信号 建 模 ， 第 20 个 时 间 单 元 : 
always 
begin 
clk =1’ bl; 
#20; 
clk =1’ b0; 
#20; 
end 


initial 据 内 也 包含 程序 语句 。 但 它 只 在 仿真 的 一 开始 执行 ， 且 只 执行 一 次 。 
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简化 的 语法 为 
initial 
begin 
[ procedural statements ] 
end 
initial 块 通常 用 作 设 置 变量 的 初 值 ， 在 示例 1.7 中 ， 被 用 作 生 成 整个 测试 序 
列 。initial 块 “ 运 行 一 次 ”的 行为 通常 是 不 可 综合 的 。 


7.5.2 程序 语句 


程序 语句 在 initial Jt, always 块 、function 和 task 内 使 用 ， 经常 使 用 的 程序 
语句 有 : 

e 阻塞 赋值 ; 

e 非 阻 塞 赋值 ; 

e 开 语 句 ; 

@ case 语句 ; 

e 循环 语句 。 

我 们 已 经 在 7. 1 节 讨 论 了 阻塞 和 非 阻塞 赋值 。 并 在 3.4 节 和 3.5 节 讨 论 了 了 
if Fil case 语句 。 

Verilog 支持 4 种 循环 结构 : for, while, repeat 和 forever, for 循环 的 简化 语 
法 为 


for( [ initial-assignment | ; [ end - condition | [ step-assignment | ) 


begin 
[ procedural-statements; | 
end 
例如 ， 可 以 清除 16word 的 寄存 器 组 。 
integer 1; 


for (120; 1<16; і=1+1) 
reg_ file [i] =0; 
注意 ， 如 果 只 有 一 名 语句 ，begin 和 end 分 隔 符 可 以 省 略 。while 循环 的 简化 
语法 为 
while ( [ end-condition ] ) 
begin 
[ procedural-statements ; ] 


end 


loop 循环 体内 的 语句 不 停 地 重复 ， 直 到 [end-condition ] 条 件 表达 式 满足 。 例 
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如 ， 之 前 的 清除 寄存 器 操作 也 可 以 用 while 循环 完成 。 


Integer 1; 


i=0; 
while (i < 16) 
begin 
reg_file [i] =0; 
islets 
end 
repeat 循环 的 简化 语法 为 
repeat( [ number ] ) 
begin 
[ procedural-statements; | 
end 
循环 体内 的 循环 会 重复 特定 次 数 ， 通 过 指定 [number] 参 数 实现 。 例 如 ， 之 
前 的 操作 也 可 以 用 repeat 循环 完成 : 


integer 1; 


iz; 
repeat (16) 
begin 
reg-file [1] 20; 
1=1+1; 
end 
forever 循环 的 简化 语法 为 
forever 
begin 
[ procedural-statements ; | 
end 
forever 循环 ， 顾 名 思 义 ， 就 是 重复 执行 循环 体 ， 直 至 仿真 结束 。 循 环 体 通常 
包含 特定 的 时 序 控制 结构 ， 这 样 可 以 被 系统 周期 性 挂 起 。 例 如 ， 下 面 的 代码 片段 
是 另外 一 种 描述 时 钟 信号 的 方法 ， 每 隔 10 个 时 间 单 元 翻转 ， 并 一 直 运 行 。 
initial begin 
clk 21' b0; 


forever 
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#10 clk = ~clk; 


end 
7.5.3 时 序 控制 


在 测评 平台 中 ， 必 须 指 定 不 同 信 号 的 激活 和 无 效 时 间 ， 或 者 等 待 某 些 事件 或 
条 件 。 有 三 种 时 序 控制 结构 : 

e 延 时 控制 : # [ delay-time] ; 

e 事件 控制 : @( [eventl, [eventl, ...); 

e 等 待 控制 : wait ( [ boolean expression | ) 。 

另外 ， 一 个 编译 指令 ，“timescale， 也 与 时 序 规格 有 关 。 


7.5.4 延 时 控制 


延 时 控制 通过 # 符 号 与 紧 跟着 的 时 间 值 表示 。 通 过 指定 的 数目 来 延迟 程序 语 
名 的 执行 。 若 延 时 控制 放置 于 左边 ， 则 整个 语句 的 执行 就 会 被 延迟 。 例 如 ， 思 考 
下 列 代码 片段 : 


#10 а=1”Ь0; 
#5 y=a | b; 


假设 当前 的 仿真 时 间 为 :， 上 述 语句 表示 a 将 会 在 ++10 时 刻 获 取 0， 再 过 5 
个 单位 时 间 ( 即 在 :+15 时 刻 ) al b 表达 式 的 值 被 计算 并 将 结构 赋值 给 y。 

如 果 延 时 控制 被 放置 在 右边 ， 表 达 式 的 计算 会 立即 执行 ， 但 赋值 给 左边 变量 
的 行为 会 被 延迟 。 思 考 下 面 代码 片段 : 


#10 a=1’ b0; 
y= al b; 


同样 ，a 会 在 :+10 时 刻 获 取 0，al b 表达 式 的 求 值 会 马上 进行 ( 即 在 上 +10 
时 刻 ) ， 但 在 :+15 时 刻 才 会 将 结果 赋值 给 y。 

经 常会 使 用 延 时 控制 在 测试 平台 中 产生 一 个 激励 ， 而 不 是 用 于 建 模 传播 延 
时 。 下 面 格式 的 代码 更 直观 些 : 


a=l b0; //a 为 0 
#10; //0 (E RRAEIO 个 时 间 单 位 
а=1”Ь1; //a BHI 


- 218 - 用 Verilog 设计 FPGA 样机 实例 解析 (Xilinx Spartan-3 版 ) 





7.5. 


ft. 


85/71 值 持续 5 个 时 间 单 位 
a=1' b0; //a BHO 
#20//0 值 桂 续 20 个 时 间 单 位 


5 事件 控制 


事件 控制 通过 @ 符 号 与 紧 跟 着 的 敏感 列表 表示 ， 敏 感 列表 可 指定 期 望 的 事 
事件 控制 与 在 always 块 中 的 使 用 相似 。 事 件 是 指 敏感 列表 信和 号 的 值 发 生 了 


变化 ( 即 信号 转换 ) posedge 和 negedge 两 个 关键 字 可 以 添加 到 敏感 列表 中 ， 以 
指定 期 望 的 转换 沿 ( 即 上 升 沿 或 下 降 沿 ) 。 在 测试 平台 中 ， 执 行 会 被 挂 起 ， 直 到 
其 中 一 个 指定 的 事件 发 生 。 事 件 控制 的 一 个 常见 应 用 是 将 激励 的 产生 与 时 钟 信和 号 
同步 。 例 如 ， 下 面 的 代码 片段 置 使 能 信号 en 有 效 一 个 时 钟 周期 。 


1.5. 


е 


localparam delta = 1; 


@ ( posedge clk) // ARAL Bh ЕТ 

#delta; // 等 待 delia ЮВ], AER ТКЕН ALTE IZ 
enzl'bl // Hen=1 fs 

@ ( posege clk) // 等 等 下 一 个 时 负 上升 沿 
#delta; // 等 等 delia ЮН], HERE PREF IT |H] us С 
en z1' b0 // Zen =0 ЖЖ 


另外 ， 也 可 以 在 时 钟 下降 沿 置 en 信号 有 效 和 无 效 : 


@ (negdge clk) // SH Bh F KE 
en=1’bl // Hen=1 Axx 

@ (negdge clk) // Sf Р SH К Т 
en =1'b0 // Hen 0 ЖЖ 


6 wait 语句 


wait 语句 等 待 某 个 特定 的 条 件 ， 简 化 的 语法 为 

wait [ boolean_expression | 

后 面 语句 的 执行 将 会 被 挂 起 ， 直 到 通过 [ boolean-expression ] 指定 的 条 件 为 
例如 ， 可 以 编码 这 样 的 代码 : 

wait (state = READ && men ready = =1 'bl) [statement to get data]; 
也 可 以 使 用 wait 语句 挂 起 执行 。 例 如 ， 可 以 等 待 一 个 计数 器 计 到 15， 然 后 
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再 激活 某 个 信号: 


wait( counter = =4”Ь1111); // fF, ELSUjHZ15 W 

e // 继续 

wait 语句 与 事件 控制 有 些 相 似 。 后 者 等 待 特 定 信 号 的 转换 沿 ， 而 前 者 等 待 特 
定 的 条 件 ， 有 时 被 认为 是 电 平 敏感 。 


7.5.7 timescale 指令 


编译 器 指令 被 用 于 控制 Verilog 代码 的 编译 和 处 理 。 前 面 标 有 重音 符 (“ ) ， 
通常 位 于 键盘 的 左上 角 。 其 中 一 个 时 序 相关 指令 是 “timescale 指令 ， 它 的 语法 为 
“timescale [ time-unit | / [ time-precision | 
[ time-unit ] 用 于 指定 时 间 和 延 时 测试 单元 ，[ time-precision ] 用 于 指定 仿真 的 
A ER 
例如 ， 指 令 : 
“timescale 10ns / Ins 
表示 仿真 的 单位 是 1Ons, DRA Ins, “RENTERS HREM, WH; 
#5 y=a & b; 
这 表示 实际 的 延 时 是 50ns( 即 5 x 10ns) 。 
延 时 规格 可 为 单位 的 小 数 ， 如 : 
#5. 12345 y =a & b; 
表示 实际 延 时 是 51. 2345ns， 由 于 精度 是 lns， 因 此 会 在 仿真 中 被 含 人 到 51ns。 
更 高 的 精度 会 增加 仿真 的 准确 性 ， 但 可 能 会 减 小 仿真 速度 。 
[time-unit] 和 [time-precision ] 数字 部 分 可 以 为 1、10 或 者 100, 时 间 单 位 可 
为 s( 秒 ) 、ms( 毫秒 ) 、ns( 微 秒 ) ns( NBD). ps ЖЖ) RE fs КР) 。 


7.5.8 系统 函数 和 任务 


Verilog 有 一 组 定义 好 的 系统 函数 和 任务 ， 执 行 系统 相关 的 操作 ， 例 如 仿真 
控制 和 文件 存 取 。 这 些 函 数 和 任务 以 美元 符 $ 开头 。 我 们 将 会 在 这 一 小 节 检 验 一 
些 常 用 的 函数 和 任务 。 

1. 数据 类 型 转换 函数 ”$$ unsigned 和 $ signed 函数 用 于 无 符号 和 有 符号 数 
据 类 型 之 间 的 转换 。 它 们 的 使 用 已 经 在 7. 3 节 讨 论 过 。 

2. 仿真 时 间 函 数 ”仿真 时 间 函 数 返 回 当 前 的 仿真 时 间 ，$ time, $ stime 和 
$ realtime 三 个 函数 分 别 将 时 间 按 64 位 、32 位 和 实数 类 型 返回 。 

з. 仿真 控制 任务 “有 两 个 仿真 控制 任务 ，$ finish 和 $ stop. $ finish 用 于 

结束 仿真 并 退出 仿真 程序 。 $ stop 用 于 挂 起 仿真 。 在 ModelSim 中 ， 以 交互 的 方 


: 220 - ДЇ Verilog iit FPGA 样机 实例 解析 (Xilinx Spartan-3 版 ) 





式 返回 仿真 。 在 开发 流程 中 ， 经 常会 停留 在 ModelSim 环境 中 来 做 近 一 步 编 辑 或 
检验 波形 ， 可 以 在 代码 中 使 用 $ stop 任务 完成 。 

4. 显示 任务 2.4 节 讨 论 的 开发 流程 与 在 实验 平台 做 实验 很 相似 。 仿 真 结果 
以 波形 形式 在 ModelSim 中 显示 。ModelSim 模仿 实验 平台 上 使 用 的 逻辑 分 析 仪 。 
另外 一 种 显示 结果 的 方式 是 文本 。4 个 主要 的 显示 系统 函数 为 $ display, $ 
wirte, $ strobe 和 $ monitor。 这 几 个 函数 有 着 相似 的 语法 ， 可 以 在 仿真 过 程 中 显 
示 文 本 。 在 ModelSim 中 ， 文 本 显示 在 控制 台 上 。 

$ display 的 格式 与 C 语言 的 打印 函数 相似 。 简 化 的 语法 为 

$ display ( [format string], [argument], [argument], ...); 
[ format — string] 包 含 了 常规 的 字符 和 ” 换 码 顺序 ”， 用 以 指定 相应 参数 的 显示 格 
式 。 当 字符 串 被 显示 时 ， 相 应 参数 值 会 被 代替 到 字符 串 中 ， 并 以 指定 的 格式 显 
示 。 例 如 ， 在 下 列 语句 中 : 

$ display ("at 96d; signal x 296b", $ time, x); 
Фоа 和 %b 是 换 码 顺序 ， 用 于 指定 当前 仿真 时 间 和 x 要 以 十 进 制 和 二 进 制 格式 显 
示 ， 相 应 地 ， 结 果 显 示 为 

at 5100; signal x =00110001 

仿真 中 常用 的 换 码 顺序 有 和 d .% b .% o % h .% c .% s Fil% g, 分 别 表示 十 进 
制 、 二 进 制 、 八 进 制 、 十 六 进 制 、 字 符 、 字 符 串 和 实数 。 

$ write 任务 几乎 与 $ display 任务 相同 ， 唯 一 的 区 别 就 是 $ write 不 会 在 字符 
的 末尾 添加 换行 符 。 相 关 显 示 任 务 从 当前 位 置 继 续 输 出 。 换 行 符 ，\n， 必 须 手 
动 添加 到 字符 串 中 来 结束 一 行 的 显示 。 

Verilog 包含 了 时 间 片 的 概念 ， 用 来 对 传播 延迟 进行 建 模 。 如 7. 5.7 节 所 讨论 
的 。 许 多 活动 可 以 在 一 个 时 间 片 内 发 生 。$ strobe 任务 与 $ display 任务 相似 。 
$ strobe 在 当前 的 时 间 片 的 末尾 执行 ， 而 不 是 立即 执行 。 避 免 了 由 于 竞 态 条 件 导 
致 的 数据 显示 不 一 致 的 问题 。 

$ monitor 任务 是 一 个 非常 通用 的 命令 ， 鉴 于 $ display, $ write 或 $ strobe 
只 在 每 次 执行 时 显示 一 次 文本 ，$ monitor 在 每 次 参数 值 发 生变 化 时 ， 都 会 显示 。 
$ monitor 为 仿真 的 跟踪 提供 了 简单 灵活 的 方式 。 例 如 ， 可 以 在 示例 1.7 的 测试 
平台 中 添加 下 列 代码 片段 : 

initial 

begin 

$ display( “time test inO test inl test_out” ); 
$ monitor( " 96 d 9b b 96 b 95b", 
$ time, test inO, test inl, test out) ; 


end 
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文本 仿真 结果 显示 在 控制 台中 : 


time test. inÜ test. inl test. out 
0 00 00 l 
200 01 00 0 
400 01 11 0 
600 10 10 1 
800 10 00 0 
1000 11 11 1 
1200 11 01 0 


文件 VO 系统 ”函数 与 任务 Verilog 提供 了 一 套用 于 访问 数据 文件 的 函数 和 
任务 。 文 件 可 通过 $ fopen 和 $ fclose 函数 打开 和 关闭 。$ fopen 的 简化 语法 为 

[med – пате | = $ fopen (“ [file - name ] ” ) ; 

$ fopen 函数 返回 一 个 与 文件 相关 的 32 位 多 通道 描述 符 。 描 述 符 可 被 看 作 
一 个 32 位 的 标准 ， 每 一 位 代表 一 个 文件 (也 就 是 通道 ) 。 最 低位 为 标准 输出 ( 即 
控制 台 ) 保留 。 当 函数 被 调用 且 文 件 成 功 打开 ， 函 数 返回 一 个 带 有 1bit 有 效 位 的 
描述 符 。 例 如 ，0…0010 是 第 一 个 打开 的 文件 返回 值 ，0....…. 0100 是 第 二 个 打 
开 的 文件 返回 值 ， 依 次 类 推 。 函 数 返回 值 全 为 0 表示 打开 失败 。 

一 旦 文件 被 打开 , 便 可 以 使 用 4 种 改进 的 显示 系统 任务 ( $ fdisplay、 
$ fwrite, $ fstrobe 和 $ fmonitor) 写 人 数据 。 除 了 多 通道 描述 符 作为 第 一 个 参数 
被 使 用 ， 与 原始 的 任务 相似 。 如 : 

$ fdisplay( [ med name], [format string], ©); 

一 个 简单 示例 代码 片段 如 示例 7. 13 所 示 。 

示例 7. 13 写 文 件 示 例 


integer log_file, both_file; 
localparam con file = 16’ h0000 0001 ; // Ss 
initial 
begin 

log file = $ fopen( "my log"); 

if (log file = 20) 

$ display( “ Fail to open log file”) ; // FAH 
// ЯН SOLE PBA 
$ fdisplay( both file, “ Simulation Started” ) ; 


// 只 向 日 志文 件 中 写 人 
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$ fqisplay(log_file，… ); 


ААЛИ A ESE PRA 
$ fdisplay(both_file, “ simulation ended" ) ; 
$ fclose(log file) ; 


end 


注意 ， 可 以 通过 对 多 通道 描述 符 进 行 位 运算 或 操作 来 创建 新 的 描述 符 ， 如 示 
例 中 的 both file 变量 。 当 both file 被 使 用 时 ， 文 本 就 会 被 写 人 到 控制 台 和 日 志 
件 中 。 

Verilog 获取 外 部 文件 数据 有 两 个 简单 的 系统 任务 : $ readmemb 和 $ read- 
memh。 这 两 个 任务 假设 外 部 文件 存储 内 容 分 别 是 二 进 制 和 十 六 进 制 格式 的 数组 。 
简化 的 语法 为 


$ readmemb( “ [ file_name | 


» 


, [ mem. variable] ) ; 
$ readmemh( “ [ file name]" , [ mem, variable] ) ; 
下 列 代 码 片 段 对 8 x4 数组 的 获取 进行 了 说 明 : 
reg [3: 0] у тет [0: 7] 


$ readmemb( “vector. txt”, Уу mem); 


文件 中 应 包含 8 个 4bit 二 进 制 数据 ， 并 通过 空格 分 隔 。 
使 用 文件 操作 函数 和 任务 ， 将 使 用 外 部 分 件 指定 测试 向 量 和 记录 仿真 结果 成 
为 可 能 。 回 顾 示例 1.7 的 测试 平台 ， 可 以 修改 为 文件 操作 ， 如 示例 7. 14 所 示 。 
示例 7. 14 基于 文件 操作 的 测试 平台 


‘timescale 1 ns/10 ps 
module eq2_file_tb; 
// 信号 声明 
reg [1: 0] test_in0, test inl; 
wire test out; 
integer log file, console file, out file; 
reg [3: 0] v mem [0: 7]; 
integer i; 
// SAAC BMY HELE 


eq2_sop uut 
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(. а(їеї_1п0), . b(test inl) , . aeqb(test out) ) ; 
initial 
begin 
// 设置 输出 文件 
log file = $ fopen( "eqlog. txt" ) ; 
if (! log file) 
$ display( " Cannot open log file" ) ; 
console, file = 32° h0000. 0001 ; 
out file = log file | console file; 
// ‘ei Й 
$ readmemb( " vector. txt" , v mem); 
// 测试 发 生 带 循环 注 历 8 个 浏 试 向 量 
for(i=0; 1<8; i=i+1) 
begin 
{test_in0 ,test_inl | =v_mem[i]; 
3200; 
end 
// TES E 
$ fclose(log file) ; 
$ stop; 
end 
// 文本 显示 
initial 
begin 
$ fdisplay(out file," time test inO test inl test ош"); 
$ fdisplay( out. file," (a) (b) (aeqb) "); 
$ fmonitor( out. file," 96 10d 96b 96b 96b", 
$ time, test inO, test inl, test out) ; 
end 


endmodule 


测试 向 量 为 存 人 于 vector. txt 文件 中 的 指定 的 4bit 二 进 制 数据 。 文 件 内 容 为 
00_00 
01_00 
01_11 
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10_10 

10_00 

11 11 

11 01 

00 10 

文件 被 读 人 到 二 维 变量 v. mem 中 。 测 试 向 量 生成 器 使 用 一 个 for 循环 遍历 8 
个 测试 向 量 。 仿 真 结果 被 写 人 到 控制 台 和 日 志文 件 eqlog. txt 中 。 日 志文 件 的 内 


time test 100 test inl test out 

(a) (b) ( aeqb) 
0 00 00 l 
200 01 00 0 
400 01 11 0 
600 10 10 1 
800 10 00 0 
1000 11 11 1 
1200 11 01 0 
1400 00 10 0 


日 志文 件 是 一 个 常规 文本 文件 ， 可 以 被 任何 文本 编辑 顺 查 看 。 
7.5.9 自 定义 函数 和 任务 


一 个 复杂 的 测试 平台 可 能 会 非常 元 长 和 繁杂 。 一 种 控制 这 种 复杂 性 的 方式 是 
将 代码 分 割 成 一 些 更 小 的 部 分 。 函 数 和 任务 可 以 帮助 实现 这 件 事 。 我 们 在 7.4 节 
已 经 讨论 了 Verilog 的 函数 。 函 数 带 有 输入 参数 并 返回 一 个 数值 。 当 被 调用 时 ， 
函数 会 马上 被 执行 且 函 数 内 部 不 允许 有 时 序 控制 结构 。 
任务 更 加 灵活 和 通用 。 它 可 以 有 输入 、 输 出 和 双向 的 参数 ， 还 可 以 包含 时 序 
控制 结构 。 通 过 输出 和 双向 参数 ， 多 个 值 可 以 被 返回 。 与 函数 相同 ， 任 务 也 必须 
在 模块 内 部 声明 。 任 务 的 基本 语法 为 
task [task id] ([arg]); 
begin 
[ statements | ; 
end 
endtask 
[ arg 为 参数 声明 部 分 。 除 了 默认 数据 类 型 是 reg 以 及 wire 类 型 不 能 被 使 用 
外 ， 它 的 语法 格式 与 端口 声明 相似 。 示 例 7. 15 展示 了 使 用 任务 实现 的 2bit 相等 
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比较 器 的 建 模 。 
示例 7.15 使 用 任务 实现 的 2bit 比较 器 


module eq2 task 
( 
input wire [1: 0] a, b, 
output reg aeqb 
у; 
гер е0, е1; 
always @ * 
begin 
equ tsk(2, a[0], b[0], e0); 
equ tsk(2, a[1], b[1], el); 
aeqb = e0 & el; 
end 
//task 定义 
task equ. tsk 
( 
input integer delay, 
input 10, il, 
output ед1 
)5 
begin 
#delay eql = ( ~i0 & ~il) | (i0 & il); 
end 
endtask 


endmodule 


注意 ， 操 作 的 传播 延 时 通过 #delay 指定 ， 延 时 值 通过 delay 参数 传人 任务 中 。 


出 于 比较 目的 ， 使 用 函数 重 写 的 代码 ， 详 见 示例 7. 16。 
示例 7.16 使 用 函数 实现 的 2bit 比较 器 


module eq2_function 


( 
input wire [1; 0] a, b, 
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output reg aeqb 


begin 
#2 e0 = еди fnc(a[0], b[0]); 
#2 el =equ_fne(a[1], b[1]); 
aeqb =е0 & el; 
end 
// 功能 定义 
function equ_fnc( input 10, 11); 
begin 
equ fne 2 ( ~i0 & ~il) | (i0 & il); 
end 
endfunction 


endmodule 


注意 ， 函 数 不 能 包含 时 序 控制 。 为 达到 同样 的 效果 ， 延 时 必须 只 能 在 always 


块 中 指定 。 
7.5.10 复杂 测试 平台 示例 


学 习 完 这 些 附 加 的 语言 结构 ， 便 可 以 开发 一 个 更 加 复杂 的 测试 平台 。 再 次 考 
虑 示例 4. 10 中 的 通用 二 进 制 计数 器 的 测试 平台 。 新 的 测试 平台 的 概要 框图 如 图 
7-3 所 示 。 里 面 有 3 个 模块 。 除 了 计数 器 ，bin_gen 模块 生成 测试 向 量 ，monitor 


模块 监视 输入 激励 和 输出 响应 。 


测试 向 量 生成 模块 ”如 示例 4.12， 直 接生 成 测试 向 量 是 个 元 余 和 乏味 的 过 
程 。 一 个 更 好 的 选择 是 开发 一 套 对 应 不 同 操作 的 抽象 程序 。 这 会 使 代码 更 好 组 织 
更 易 理 解 。 单 独 的 程序 可 以 使 用 任务 完成 。 例 如 在 前 面 的 测试 平台 中 ， 可 以 定义 


一 个 用 于 实现 计数 器 数据 载 人 操作 的 任务 : 
task load_data( input wire [N -1 ; 0) data іп); 
begin 
@ (negedge clk); — // SF FIER 
load =1’ bl; 
d dais in; 
@ ( переве clk) ; 
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图 73 复杂 的 测试 平台 结构 框图 


load =1'b0; 

end 

endtask 

在 任务 中 ，load 在 两 个 下 降 沿 之 间 被 置 位 一 个 时 钟 周期 且 数 据 data. in 放 到 
d 中 。 

一 些 其 他 任务 可 以 按 同样 的 方式 定义 : 

€ clr counter async; 通过 生成 一 个 短 的 reset 脉冲 对 计数 器 异步 复位 ; 

€ clr_counter_ sync: 通过 激活 syn elr 信号 一 个 时 钟 周期 对 计数 器 异步 复位 ; 

€ count; 使 能 计数 器 向 上 或 向 下 计数 一 定数 量 的 时 钟 周期 ; 

€ initialize: 设置 仿真 初始 值 并 生成 一 个 复位 脉冲 。 

利用 这 些 程序 ， 可 以 用 更 加 抽象 的 方式 生成 测试 向 量 ; 


initial 


begin 
initialize( ) ; 
count(12, 1); // 向 上 计数 12 SA 
count(6, 0); // 向 下 计数 6 个 局 斯 
load_data(3'b011); // HAOII 
count(2, 1); // 向 上 计数 2 个 周期 
clr_counter_sync( ) ; // А638 
cont(3, 1); // 向 上 计数 3 个 周期 
clr_counter_sync( ) ; // HAGE 


count(5, 1); // 向 上 计数 5 个 周期 
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$ stop; // WAIE 
end 
完整 的 代码 如 示例 7. 17 所 示 。 
示例 7.17 测试 向 量 生成 器 


module bin_gen 
#( parameter N =8, T=20) 
( 
output reg clk, reset, 
output reg syn. clr, load, en, up, 
output reg [N -1: 0] d 
ji 
// ВВВ 
// hF#h— В2217 
always 
begin 
elk=1'b1; 
#(T/2) ; 
clk =1’ b0; 
#(T/2); 
end 
// 测试 程序 
initial 
begin 
initialize( ) ; 
count(12, 1); // 向 上 计数 12 个 周期 
count(6, 0); // 向 下 计数 6 个 周期 
load. data(3' b011) ; // BA ACUTA 
count(2, 1); // 向 上 计数 2 个 周期 
clr counter. sync( ) ; 
count(3, 1); // 向 上 计数 3 个 周期 
clr counter async( ) ; 
count(5, 1); // 向 上 计数 5 个 周期 
$ stop; // simulation 停 | 上 


end 
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// ТЕШ PRY Z [B] Bi reset A3 
task clr counter async( ) ; 
begin 
@ ( negedge clk) ; // SEP PIER 
reset 2 1' bl; 
#(T/4) ; // 有 效 4AT 时 间 
reset = 1' b0; 
end 
endtask 
task initialize( ) ; 
// 系统 初始 化 
begin 
en =0; 
up =0; 
load =0; 
syn clr =0; 
d 23' b000; 
clr counter. async( ) ; 
end 
endtask 
// Bisyn clr ДЖ — PHY BAY 
task clr counter sync( ) ; 
begin 
@ ( negedge clk) ; // 等 待 下 降 沿 
syn clr21'bl;  //clear EA 
@ ( negedge clk) ; 
syn, clr =1’ b0; 
end 
endtask 
// BLA PETERE 
task load. data( input wire [N —1; 0] data in); 
begin 
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@ ( negedge clk) ; // S48 PREY 
load =1’ bl; 
d = data in; 
@ ( negedge clk); 
load = 1° b0; 
end 
endtask 
// 向 上 ( 下) 计数 C 个 周期 
task count( input integer C, input integer UP_DOWN) ; 
begin š 
€ ( negedge clk) ; // ERR REEL 
en=1’bl; 
if (UP_DOWN = =1) // Пир down 为 1 ， 向 上 计数 
up=1'bl; 
repeat( C) @ (negedge clk) ; 
en - 1' b0; 
up =1’b0; 
end 
endtask 


endmodule 


监视 模块 ”监视 模块 监视 并 记录 计数 器 的 活动 并 验证 相应 操作 。 完 整 的 代码 
如 示例 7. 18 所 示 。 
示例 7.18 监视 器 


module bin_monitor 

#( parameter N 23) 

( 
input wire clk, reset, 
input wire syn clr, load, en, up, 
input wire [N-1; 0] d, 
input wire max tick, min tick, 
input wire [N-1: 0] q 

) 

reg [N-1: 0] q old, d old, gold; 
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reg syn_clr_old, en_old, load_old, up_old; 
reg [39: 0] err msg; //5 个 字母 的 信息 
initial // 开头 
$ display( "time syn. clr/load/en/up qn"); 
always @ ( posedge clk ) 
begin 
// old: E-P ERER H IBGE 
syn clr old <= syn clr; 
en old «- en; 
.load old <= load; 
up old «- up; 
q old «24; 
d old <=d; 
// 计算 期 望 的 “黄金 "参考 值 
if (syn_clr_old) 
gold =0; 
else if (load_old) 
gold = d_old; 
else if (en_old & up_old) 
gold 2q old +1; 
else if (en old & ~up_old) 
gold 2q old - 1; 


else 
gold 2q old; 
// 错误 信息 
if (q = = gold) 
err msg =" "; // 结果 通过 
else 
em msg-"ERROR";  // 绪 黑 未 通过 
ZN 


$ display("%5d, %b%b%b%b Wd %s", 
$ time, syn_clr, load, en, up, q, err_msg) ; 
end 


endmodule 
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由 于 计数 器 是 一 个 同步 时 序 电 路 ， 因 此 ， 监 视 模 块 主要 关注 时 钟 上 升 时 刻 的 
活动 。 关 键 是 检验 计数 器 操作 的 正确 性 。 由 于 被 测试 电路 只 是 一 个 简单 的 记录 
器 ， 可 以 从 前 一 个 采样 沿 记录 采样 的 输入 值 和 计数 器 状态 ， 并 判断 新 的 计数 器 状 
态 。 例 如 ， 如 果 ѕуп сіг 的 前 一 个 采样 值 为 1， 那 么 计数 器 会 在 下 一 个 上 升 沿 清 
Ж 

代码 主要 是 一 个 always 块 ， 在 时 钟 上 升 沿 触 发 。 包 含 三 段 。 第 一 段 使 用 非 
阻塞 语句 推荐 寄存 器 ， 使 用 _old 后 级 并 存储 从 前 一 采样 沿 采 样 的 数值 。 第 二 段 用 
这 些 数值 计数 期 望 的 计数 器 输出 ， 即 黄金 参考 。 最 后 一 段 将 期 望 的 计数 器 输出 值 
与 实际 输出 值 比较 并 显示 采样 的 输入 信和 号 和 计数 器 输出 值 。 如 果 出 现 不 匹配 ， 则 
会 产生 一 个 ERROR 人 信息。 注意, 在 Verilog 中 ,字符 被 当 作 8bit 数字 ， 这 样 5 个 
字母 的 信息 ，err-msg， 被 声明 为 reg[39: 0]. 

顶层 模块 ”测试 平台 顶层 模块 的 代码 如 示例 7.19 Sta, 设计 遵循 图 7-3 所 
示 的 框图 。 

示例 7.19 测试 的 顶层 模块 


timescale 1 ns/10 ps 
module bin. counter. tb3( ) ; 
// EBH 
localparam Т 220; // It ghi] Bj] 
wire clk, reset; 
wire syn clr, load, en, up; 
wire [2: 0] d; 
wire max tick, min tick; 
wire [2: 0] q; 
//uut 实例 化 
univ. bin counter #(. N(3) ) uut 
(. elk(clk) , . reset(reset) , . syn clr(syn clr), 
.load(load) , . en(en), . up(up), .d(d), 
. max tick( max tick) , . min tick(min tick), . q(q)) ; 
// WEERA 
bin gen #(. N(3), . T(20)) gen unit 
(. elk(clk) , . reset(reset) , . syn elr(syn clr), 
.load(load), . еп(еп), . up(up), .d(d)); 
// bin monitor 实例 化 
bin monitor #(. N(3)) mon unit 
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(. elk(clk) , . reset( reset), . syn clr(syn сіг), 
.load(load), .en(en), .up(up), .d(d), 
. max tick( max tick) , . min tick( min бск), . q(q)) ; 


endmodule 


除了 波形 ， 测 试 平 台 还 会 在 控制 台 产 生 文 本 输出 。 
time syn_clr/load/en/up q 


0 
20 


0000 
0011 
0011 
0011 
0011 
0011 
0011 
0011 
0011 
0011 
0011 
0011 
0011 
0011 
0000 
0010 
0010 


ERROR 
ERROR 


л л > WBWA С\ М © — NW + ++ шо (м — OTOH DUN + UN e C Ou 
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560 0000 0 
580 0011 0 
600 0011 1 
620 0011 2 
640 0000 3 
660 0000 0 EEROR 
680 0011 0 
700 0011 l 
720 0011 2 
740 0011 3 


760 0011 4 

有 3 个 ERROR 信息 。 在 系统 初始 化 过 程 中 , 在 0 和 20 HAT ERROR 信 
息 ， 不 是 真正 的 错误 。 在 660 时 刻 出 现 的 信息 是 由 于 clr_counter_async ( ) 操作 所 
致 ， 该 操作 在 640 和 660 时 刻 的 采样 沿 之 间 产 生 一 个 短 的 异步 脉冲 。 由 于 测试 平 
台 只 监视 同步 活动 ， 因 此 会 错过 异步 复位 并 报告 一 个 错误 。 


7.6 文献 备注 


由 Palnitkar 编著 的 《Verilog HDL, 2™ edition》 和 M. D Ciletti 943 BJ Starter’ s 
Guide to Verilog2001》 涵 盖 了 Verilog 语法 和 结构 。IEEE Standard Verilog Hardware 
Description Language, IEEE Std 1364 -2001 提供 了 关于 有 符号 和 无 符号 数据 类 型 
混合 表达 式 调 整 的 规则 。J. Bergeron 编著 的 《Writing Testbenches; Functional Veri- 
fication of HDL Models, 2"! edition》 一 书 对 测试 平台 开发 提供 了 详尽 的 讨论 。 
C. E. Cummings 的 论文 《Nonblocking Assignments in Verilog Synthesis, Coding Styles 
That Kill!》 为 合理 使 用 阻塞 和 非 阻塞 赋值 提供 了 指南 。 


7.7 实验 


7.7.1 使 用 阻塞 和 非 阻塞 赋值 的 移 位 寄存 器 


示例 7. 20 所 示 代 码 是 描述 移 位 寄存 器 的 三 种 尝试 。 通 过 三 种 尝试 得 到 推断 
电路 ， 并 判断 它们 是 否 推断 出 了 一 个 移 位 寄存 器 。 
示例 7.20 实验 7.7.1 代码 


module expl 
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( 
input wire clk, 
input wire xO , yO ,z0 , 
output reg x3 ,y3 ,z3 
23 
reg xl ,x2,yl,y2,zl ,22; 
// 尝试 1 
always @ ( posedge clk) 
begin 
xl «zx0; 
x2 «zxl; 
x3 «2x2; 
end 
// $2 
always € ( posedge clk ) 
begin 
yl = y0; 
у2 =у1; 
уЗ =y2; 
епа 
// 尝试 3 
always @ ( posedge clk) 
begin 
zl 220; 
23 =72; 
z2-zl; 
end 


endmodule 


7.7.2 BCD 计数 器 的 另 一 种 代码 风格 


使 用 7. 2 节 讨 论 的 代码 风格 重新 编写 示例 4. 18 中 的 BCD 计数 器 ， 重 新 综合 
电路 并 验证 其 运行 正确 性 。 
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7.7.3 FIFO 缓冲 器 的 另 一 种 代码 风格 


使 用 7. 2 节 讨 论 的 代码 风格 重新 编写 示例 4. 20 中 的 FIFO 缓冲 器 。 重 新 综合 
电路 并 验证 其 运行 正确 性 。 


7.7.4 斐 波 纳 契 数 电路 的 另 一 种 代码 风格 
使 用 7. 2 节 讨论 的 代码 风格 重新 编写 6. 3. 1 节 讨 论 的 斐 波 纳 契 数 电路 。 
7.7.5 双 模 式 比较 器 


双 模 式 比 较 器 有 两 个 8bit 数据 输入 ，a 和 b， 可 以 是 有 符号 或 无 符号 整 型 数 
据 。 一 个 控制 信号 ，mod， 用 于 指示 期 望 的 模式 。 电 路 有 一 个 输出 agtb， 当 翻译 
后 的 a 值 比 b 值 大 ， 则 置 为 有 效 。 

1) 假 设 有 符号 数据 类 型 允许 使 用 ,设计 电路 并 形成 代码 ; 

2) 综 合 电 路 并 验证 运行 的 正确 性 ; 

3) 假 设 有 符号 数据 类 型 在 代码 中 不 允许 。 重 复 步 又 1 和 2。 


7.7.6 增加 的 二 进 制 监视 器 


7. 5. 10 节 的 监视 模块 用 于 监视 一 个 同步 系统 且 只 能 检验 时 钟 上 升 沿 的 活动 。 
异步 复位 操作 会 被 当 作 一 个 错误 而 报告 。 将 异步 操作 考虑 进来 ， 修 改 监视 电路 。 
重新 生成 测试 平台 并 执行 仿真 以 验证 其 运行 的 正确 性 。 

7.7.7 FIFO 缓冲 器 测试 平台 

按 7.5. 10 节 的 例子 设计 一 个 紧凑 的 测试 平台 来 验证 4. 5. 3 节 讨 论 的 FIFO Z 

冲 器 。 测 试 向 量 生成 器 模块 应 生成 不 同 组 合 的 读 和 写 操作 ， 并 使 FIFO 产生 空 和 


满 条 件 。 监 视 模块 应 持续 监视 数据 写 人 并 从 缓冲 器 中 回 读 ， 以 检验 操作 的 正确 
性 。 


LO 模块 


* 
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8.1 引言 


通用 异步 收发 传输 器 (UART) ， 是 一 种 用 串 行 通 信 方 式 来 传输 并 行 数据 的 
电路 。UART 通常 与 EIA (电子 工业 联盟 ) 认定 的 RS-232 标准 同时 使 用 ，RS- 
232 标准 详细 说 明了 两 个 数据 通信 装置 的 电气 、 机 械 、 功 能 及 程序 特性 。RS-232 
标准 规定 的 电 平 与 FPGA 的 VO (输入 输出 ) 电压 不 相同 ， 因 此 需要 在 串口 和 
FPGA 的 VO 口 之 间 使 用 电 平 转换 芯片 。 

93 板 有 一 个 标准 9 针 的 RS-232 端口 。 板 子 上 包含 必需 的 电压 转换 芯片 并 将 
RS-232 的 控制 信号 设置 为 与 PC 的 串口 匹配 。 标 准 的 直通 电缆 用 于 连接 S3 板 和 
PC 的 串口 。S3 板 使 用 RS-232 标准 ， 我 们 只 需要 关注 UART 电路 的 设计 。 

UART 包括 一 个 发 送 器 和 一 个 接收 器 。 发 送 器 本 质 上 是 专用 的 移 位 寄存 器 ， 
它 并 行 的 加 载 数据 按照 指定 的 速率 将 数据 按 位 移出 。 男 一 方面 ， 接 收 器 按 位 接收 
并 将 数据 重新 组 合 。 当 串 行 线 空闲 的 时 候 将 串 行 线 置 1。 发 送 从 起 始 位 开始 (起 
始 位 为 0) ， 接 着 是 数据 位 和 可 选 的 奇偶 校 验 ， 最 后 是 停止 位 (停止 位 为 1 )。 数 
据 位 可 能 是 6、7 或 8 位 。 奇 偶 校 验 位 用 于 错误 检测 。 若 使 用 奇 校 验 ， 当 数据 位 
有 奇数 个 1 时 校 验 位 设置 为 0; 若 使 用 偶 校 验 ， 当 数据 位 有 偶数 个 1 时 校 验 位 设 
置 为 0。 停止 位 的 个 数 可 以 是 1、1.5 或 2。 图 8-1 为 一 个 数据 字 的 发 送 ， 这 个 数 
据 字 包 括 8 位 数据 位 、 没 有 校 验 位 和 1 位 停止 位 。 需 要 注意 的 是 ， 发 送 时 数据 字 
的 低位 在 前 高 位 在 后 。 

空闲 起 始 位 停止 位 


(ea Xe Xe ETE way 


图 8-1 一 个 字 节 的 传输 


在 串口 线 上 没有 时 钟 信息 。 在 传输 开始 前 ， 发 送 器 和 接收 器 须 将 包括 波 特 率 
( 即 ， 每 秒 传输 的 位 数 ) 、 数 据 位 和 停止 位 的 数量 和 奇偶 校 验 位 的 使 用 在 内 的 参 
数 提前 设置 好 。 通 常 使 用 的 波 特 率 为 2400bit/s. 4800bit/s, 9600bit/s 和 
19 200bit/s 

在 接 下 来 的 章节 中 我 们 将 举例 说 明 接 收 和 发 送 子 系统 的 设计 。 设 计 中 设 定 
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UART 接口 的 波 特 率 为 19 200bit/s， 有 8 位 数据 位 和 1 位 停止 位 ， 无 校 验 位 。 
8.2 UART 接收 子 系统 


由 于 输出 信号 没有 时 钟 信息 ， 接 收 模块 只 能 按 预先 确定 好 的 参数 接收 数据 。 
我 们 使 用 过 采样 法 佑 计 发 送 数据 位 的 中 间 点 ， 接 着 在 这 些 点 处 将 数据 位 取出 。 


8.2.1 过 采样 步骤 


最 常用 的 采样 速率 为 16 倍 的 波 特 率 ， 即 每 一 个 串 行 位 被 采样 16 次 。 如 果 在 
通信 中 使 用 N 个 数据 位 和 个 停止 位 ， 过 采样 过 程 如 下 : 

1) 当 传 输 信 号 为 0 时 ， 即 起 始 位 的 开始 ， 开 始 采样 计数 ; 

2) 当 计数 到 7 时 ， 即 计数 到 起 始 位 的 中 间 点 时 ， 计 数 器 清 零 后 重新 计数 ; 

3) 当 计 数 到 15 时 ， 即 到 达 第 一 个 数据 位 的 中 间 点 时 ， 取 出 输出 值 并 将 其 
锁 存 到 移 位 寄存 器 中 ， 同 时 计数 器 重新 计数 ; 

4) 重复 步骤 3) (N-1) 次 ， 接 收 余 下 的 数据 位 ; 

5) 如 果 用 到 奇偶 校 验 位 ， 重 复 步 又 3) 一 次 获得 校 验 位 ; 

6) 重复 步骤 3) M 次 获得 停止 位 。 

过 采样 法 基本 上 履行 了 时 钟 信号 的 功能 。 它 利用 采样 点 来 估计 每 一 位 的 中 间 
点 ， 而 不 是 像 时 钟 信号 那样 用 上 升 沿 来 判断 输入 信号 的 有 效 。 当 接收 端 没 有 精确 
地 获得 起 始 位 的 发 起 时 间 时 ， 所 佑 计 的 中 间 点 的 误差 最 多 为 波 特 率 的 1/16。 由 
于 使 用 过 采样 ， 串 行 传输 的 波 特 率 只 能 是 系统 时 钟 的 一 个 很 小 的 分 频 ， 因 此 ， 这 
个 方法 并 不 适用 高 数据 传输 速率 。 

UART 接受 子 系统 的 原理 框图 如 图 8-2 所 示 ， 包 括 3 个 重要 的 部 分 : 








图 8-2 一 个 UART 接收 子 系统 的 原理 框图 


e UART 接收 器 : 通过 过 采样 获得 数据 字 的 电路 ; 
e 波 特 率 发 生 器 : 产生 采样 点 的 电路 ; 
e 接口 电路 : 能 提供 缓存 和 在 UART 接收 器 和 使 用 UART 的 系统 之 间 状 况 
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的 电路 。 
8.2.2 波 特 率 产 生 器 


波 特 率 产生 器 产生 一 个 采样 信号 ， 它 的 频率 是 UART 波 特 率 的 16 倍 。 为 了 
避免 产生 一 个 新 的 时 钟 域 以 及 违反 同步 设计 准则 ， 对 UART 接收 端 来 说 ， 采 样 信 
号 作为 一 个 使 能 信号 来 使 用 ， 而 不 是 作为 一 个 时 钟 来 使 用 ， 我 们 已 在 4.3.2 节 讨 
论 这 个 问题 。 

对 于 19 200bit/s 的 波 特 率 来 说 ， 采 样 速 率 应 该 是 307 200bit/s， 由 于 时 钟 速 

=ë . 50 x 10* - 
率 为 OMHz， 因 此 需要 一 个 模 163 计数 器 (80, |. ёр 163 个 时 钟 周 其 
产生 一 个 采样 点 。4. 3. 2 节 中 提 到 的 计数 器 的 可 以 设置 为 163。 


8.2.3 UART 接收 端 


基于 我 们 对 过 采样 法 的 理解 ， 可 以 得 到 ASMD 图 表 ， 如 图 83 所 示 。 为 了 便 
于 以 后 的 修改 ， 我 们 使 用 了 两 个 常量 。 常 量 D_BIT 表示 数据 位 的 个 数 ，SB_TICK 
表示 停止 位 的 个 数 ， 停 止 位 个 数 为 1、1.5 和 2 时 对 应 SB. TICK 的 值 分 别 为 16、 
24、32。D_BIT 和 SB_TICK 在 本 设计 中 分 别 为 8 和 16。 

图 表 中 的 步骤 包含 在 8.2. 1 中 ,包含 的 3 个 状态 : 开始 、 数 据 和 停止 ， 分 别 
代表 着 起 始 位 、 数 据 位 和 停止 位 。 信 号 s_tick 是 由 波 特 康 发 生 器 产生 的 使 能 信 
号 ， 比 特 之 间 的 间隔 为 16 个 计数 点 。 只 有 s tick 为 1 时 ，FSMD 的 状态 才 发 生变 
化 。 寄 存 器 s 和 n 代表 着 两 个 计数 器 。 寄 存 器 s 对 采样 点 进行 计数 : 在 起 始 状态 
计数 到 7， 在 数据 状态 计数 到 15， 在 停止 状态 计数 到 SB_TICK。 寄 存 器 n 在 数据 
状态 下 对 接收 到 的 数据 位 进行 计数 。 对 接收 到 的 数据 通过 移 位 的 方法 组 合 到 寄存 
器 b 中 ， 状 态 信 号 x_done_tick 在 接收 进程 结束 后 置 一 个 时 钟 周期 的 1， 相 关 的 
代码 如 示例 8. 1 所 示 。 





示例 8.1 UART 接收 器 


module uart_rx 
#( 
parameter DBIT =8, // CH; 
SB TICK 216  // sticks 的 停止 位 
) 
( 


input wireclk, reset, 
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rx done tick-l 


























一 个 UART 接收 器 的 ASMD 图 


图 8-3 
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input wire rx, s_tick, 
output reg rx_done_tick, 


output wire [7: 0 | dout 


2% 
// 符号 处 理 数 据 的 声明 
localparam [1: 0] 

idle -2' b00, 
start 22' b01, 
data 22' b10, 
stop =2’bl1; 

// 信号 声明 


reg [1: O] state_reg, state_next; 
reg [3: 0] s reg, s next; 
reg [2: 0] n reg, n next; 
reg [7: 0] b reg, b next; 
// 实体 
// FSMD TAGS FUG SY TE dE 
always @ ( posedge clk, posedge reset) 
if ( reset) 
begin 
state reg «- idle; 
s reg <=0; 
n reg «-0; 
b reg <=0; 
end 
else 
begin 
state reg «-—state next; 
s reg «-s next; 
n reg «-n next; 
b reg «- b next; 
end 
// FSMD (RAE 
always @ * 
begin 
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state next = state reg; 
rx done tick = 1' b0; 
s next —s reg; 
n next = п reg; 
b next = b reg; 


case (state reg) 


idle: 
if ( ~rx) 
begin 
State next — start ; 
s next 20; 
end 
start; 
if (s_tick) 
if (s_reg = =7) 
begin 
state_next = data; 
s_next =0; 
n_next =0; 
end 
else 
s_next =s_reg +1; 
data: 
if (s tick) 
if (s reg = =15) 
begin 
s next 20; 
b next = {rx, b reg[7: 1]]; 
if (n_reg = = (DBIT-1)) 
state next — stop; 
else 
n next zn reg +1; 
end 
else 


s next 2 s reg +1; 
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stop: 
if (s tick) 
if (s_reg = = (SB TICK -1)) 
begin 
state next = idle; 
rx done tick = 1' bl; 
end 
else 
s next =s_reg +1; 
endcase 
end 
// 输出 
assign dout = b reg; 
endmodule 
8.2.4 接口 电路 


在 一 个 大 的 系统 中 ， 一 个 UART 通常 是 一 个 用 于 串 行 数据 传 递 的 外 围 电路 。 
主 系统 周期 性 地 检索 和 处 理 接收 到 的 数据 。 接 收 端 接口 电路 有 两 个 功能 : 第 一 ， 
它 提供 一 种 机 制 来 接收 有 效 的 数据 并 防止 重复 接收 ; 第 二 ， 它 为 接收 端 和 主 系统 
之 间 提 供 一 个 缓存 空间 。 通 常 有 以 下 三 种 方案 : 

ө 单 指示 触发 器 ; 

e 单 指示 触发 器 与 单字 缓冲 器 ; 

e 一 个 FIFO 缓冲 器 。 

注 : rx ready tick 信号 在 一 个 数据 字 接 收 完 后 置 一 个 时 钟 周期 的 高 电 平 。 

第 一 种 方案 用 一 个 触发 器 来 记录 是 否 有 新 的 数据 字 可 用 。 和 触发 器 有 两 个 输入 
信号 ， 一 个 是 置 位 端 (set_flag) ， 可 以 使 触发 器 输出 1; 一 个 是 清 零 端 (clr_flag , 
可 以 使 触发 器 输出 Oo rx. ready tick 与 置 位 端 (set_flag) 相连 ， 当 有 一 个 新 的 数据 
字 到 来 时 将 触发 器 置 1。 主 系统 检测 触发 器 的 输出 端 来 判断 新 的 数据 的 有 效 性 。 
clr_flag 信号 在 一 个 数据 字 接 收 完 后 置 一 个 时 钟 周期 的 高 电 平 。 项 层 模块 图 如 图 
84a 所 示 。 为 了 保持 一 致 性 ， 在 触发 器 的 输出 端 增加 一 个 反 相 器 ， 输 出 信和 号 为 
rx empty, Hifi rx empty 高 电 平 来 表示 输入 信号 是 无 效 的 。 在 这 个 系统 中 ， 主 
系统 直接 从 UART 的 移 位 寄存 器 中 接收 数据 ， 中 间 没 有 另外 的 缓存 空间 。 如 果 在 
当前 数据 正在 处 理 时 ( 即 ， 和 触发 器 一 直 处 于 高 电 平 ， 即 空 状态 ) 从 外 围 接 收 到 一 
个 新 的 数据 ， 正 在 处 理 的 数据 就 会 被 覆盖 掉 。 
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波 特 率 
产生 器 








V 





r_data 














b) 触发 器 和 一 个 单字 缓存 器 


r_data 
rd_uart 
rx_empty 








c) FIFOR FFE 


[| 84 UART 接收 子 系统 的 接口 电路 
为 了 增加 缓冲 ， 需 要 增加 一 个 单字 缓冲 器 ， 如 图 84b 所 示 。 当 rx_ready_tick 
信和 号 置 为 高 电 平时 ， 绥 存 器 将 接收 到 的 数据 字 存 人 缓冲 区 中 ， 指 示 触 发 器 也 已 经 
处 于 置 位 状态 。 接 收 器 可 以 继续 接收 数据 而 不 会 覆盖 前 一 个 数据 。 这 个 系统 的 代 
码 如 示例 8. 2 所 示 。 
示例 8.2 指示 触发 并 和 缓冲 器 的 接口 


module flag_buf 
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#( parameter W =8) // # 0107 
( 
input wireclk, reset, 
input wire clr flag, set flag, 
input wire [ W-1; 0] din, 
output wire flag, 
output wire [W – 1: 0 ] dout 
); 
// {ЗУРИН 
reg [ W-1: O]buf reg, buf next; 
reg flag reg, flag next; 
// 实体 
// FF FUSE AF A 
always @ ( posedge clk, posedge reset) 
if ( reset) 
begin 
buf reg <=0; 
flag reg «-1'b0; 
end 
else 
begin 
buf reg <= buf next; 
flag reg <= flag next; 
end 
// dg ist 
always @ * 
begin 
buf next = buf reg; 
flag next = flag reg; 
if (set flag) 
begin 
buf next = din; 
flag next 2 1' bl; 
end 
else if (сіг flag) 
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flag next = 1' b0; 
end 
// Dn 
assign dout = buf reg; 
assign flag = flag reg; 
endmodule 


第 三 种 方案 是 4. 5.3 节 中 描述 的 FIFO 缓存 器 。FIFO 缓存 器 可 以 提供 更 大 的 
缓存 空间 ， 从 而 避免 数据 覆盖 。 我 们 可 以 根据 主 系统 的 数据 要 求 来 调整 FIFO 中 
数据 位 数 。 模 块 图 如 图 84e 所 示 。 

信号 rx ready tick 与 FIFO 信号 的 写 使 能 信号 (wr) 相连 。 当 一 个 数据 字 接 收 
完 后 ， 写 信号 (wr) 置 一 个 时 钟 周 期 的 高 电 平 并 且 相 应 的 数据 被 写 人 FIFO 中 。 主 
系统 从 FIFO 读 端 口 读 出 数据 。 当 接收 完 一 个 字 后 ， 读 信号 (rd) 置 一 个 时 钟 周期 
的 高 电 平 并 移出 相应 的 数据 字 。FIFO 中 的 空 信号 (empty) 表示 是 否 有 接收 到 的 数 
据 字 。 数 据 覆 盖 错 误 发 生 在 FIFO 满 时 ， 仍 然 接收 数据 。 


8.3 UART 发 送 子 系统 


UART 发 送 子 系统 与 接收 子 系统 的 机 制 是 类 似 的 。 它 包括 一 个 UART 发 送 
器 、 波 特 率 发 生 器 和 接口 电路 。 接 口 电 路 与 接收 子 系统 类 似 ， 除 了 方向 不 一 样 : 
发 送 端的 主 系统 置 位 触发 器 或 写 FIFO, UART 发 送 器 清除 触发 器 或 读 FIFO。 

UART 发 送 器 本 质 上 来 说 是 一 个 按照 特定 的 速率 把 数据 位 一 位 一 位 输出 的 移 
位 寄存 器 。 速 率 可 以 通过 波 特 率 发 生 器 来 控制 。 因 为 不 需要 使 用 过 采样 法 ， 发 送 
端的 波 特 率 是 接收 端 波 特 率 的 1/16。 不 需要 使 用 一 个 新 的 计数 器 ，UART 发 送 端 
和 接收 端 共 用 一 个 波 特 率 发 生 器 ， 使 用 内 部 的 一 个 计数 器 来 计数 ， 每 16 个 计数 
输出 一 个 使 能 信和 号。 

UART 发 送 的 ASMD 图 表 与 UART 接收 类 似 。 信 号 tx_start 有 效 之 后 ，ASMD 
下 载 数据 ， 逐 步 执行 开始 、 数 据 和 停止 3 个 状态 并 输出 数据 。tx_done_tick 信号 
在 发 送 完成 后 置 一 个 时 钟 周 期 的 高 电 平 。 绥 存 器 tx_reg 用 来 过 滤 毛 刺 。 相 关 的 代 
码 如 示例 8. 3 所 示 。 

示例 8.3 UART 发 送 器 


module uart_tx 
#( 
parameter DBIT = 8, // SB; 
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SB_TICK =16  // #ticks 的 停止 位 


input wireclk, reset, 

input wire tx start, s tick, 
input wire [7: 0] din, 
output reg tx done tick, 


output wire tx 


Js 
// RAE TE HIARAS H 
localparam [1; 0] 
idle 22' b00, 
start -2' b01, 
data 22' b10, 
stop 22'bll; 
// fi FAA 
reg [1: 0] state reg, state next; 
reg [3; 0] s reg, s next; 
reg [2: 0] n reg, n next; 
reg [7: 0] b reg, b next; 
reg ix reg, ix next; 
/实体 
// FSMD 状态 和 数据 寄存 融 
always @ ( posedge clk posedge reset) 
if (reset) 
begin 
state reg «- idle; 
s reg <=0; 
n reg <=0; 
b reg <=0; 
x reg <=1’bl; 
end 
else 
begin 


state reg < = state next; 
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S reg «-s next; 
n reg «-n next; 
b reg <= next; 
ix reg <= іх next; 
end 
// FSMD UC GE HAD BE u 
always @ +* 
begin 
State next —state reg; 
tx done tick 2 1' b0; 
s next —s reg; 
n next = n reg; 
b next = b reg; 
Ix next = tx reg; 


case (state reg) 


idle: 
begin 
tx next =1’ bl; 
if (tx. start) 
begin 
state next — start ; 
s next 20; 
b. next = din; 
end 
end 
start : 
begin 
tx next = 1’ b0; 
if (s tick) 
if (s reg = =15) 
begin 
state next = data; 
s next =0; 
n. next 20; 


end 
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else 


s next zs reg +1; 


end 
data: 
begin 
tx. next = b reg[0] ; 
if (s tick) 
if (s reg = 215) 
begin 
s next 20; 
b next =b reg > > 1; 
if (n_reg = = (DBIT-1)) 
state next = stop; 
else 
n next = n reg +1; 
end 
else 
s next zs reg +1; 
end 
stop: 
begin 
tx next =1’ bl; 
if (s tick) 
if (s_reg = = (SB TICK -1) ) 
begin 
state next = idle; 
tx done tick =1’ bl; 
end 
else 
s next 2 s reg +1; 
end 
endcase 
end 
// 输出 


assign tx —tx reg; 
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endmodule 


8.4 UART 总 系统 简 述 


8.4.1 完整 的 UART 核 


通过 结合 接收 和 发 送 子 系统 ， 我 们 可 以 构造 完整 的 UART 核 。 顶 层 模块 连接 
如 图 8-5 所 示 。 模 块 图 表 可 以 通过 模块 实例 来 描述 ， 相 应 的 代码 如 示例 8.4 所 
示 。 





dout 


| "FU | t 
| tick 











图 8-5 完整 的 UART 框图 


示例 8.4 UART 顶层 描述 


module uart 
#( // Default setting: 
//19,200 沙特 ,8 个 数据 位 , 1 个 停止 位 , 2? FIFO 
parameter DBIT =8, /1A# 数 据 伺 
SB TICK 216, //# 对 停止 位 的 时 钾 计 时 
// XI. 5/2 个 停止 位 分 别 计 时 16/24/32 
DVSR =163， // 小 特 紊 因子 
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// DVSR =50M/ (16 * ЕЖ) 
DVSR  BIT =8, //# DVSR fi 
FIFO Wz2 //#FIFO 地 址 位 数 

//# FIFO hg = 2°" 


input wireclk, reset, 
input wire rd_uart, wr_uart, rx, 
input wire [7; 0] w_data, 
output wire tx_full, rx_empty, tx, 
output wire [7: 0] r data 
); 
ДАУН 
wire tick, rx done tick, tx done tick; 
wire tx empty, tx fifo not empty; 
wire [7: 0] tx fifo out, rx data out; 
// ЖЖ 
mod m. counter #(. M(DVSR) , . N(DVSR BIT)) baud gen unit 
(. clk(clk) , . reset(reset) , . q( ) . max tick(tick) ) ; 
џагі rx #(. DBIT( DBIT) , . SB TICK(SB, TICK) ) uart. rx unit 
(. elk(clk) , .reset(reset) , . rx(rx) , . s_tick(tick) , 
. rx done tick(rx done tick) , . dout(rx data out) ) ; 
fifo #(. B(DBIT), . W(FIFO W)) fifo rx unit 
(. elk(clk) , . reset(reset) , . rd(rd uart) , 
. wr( rx done tick) , . м. data(rx data out), 
. empty(rx empty), .full(), .r data(r data) ) ; 
fifo #(. B(DBIT), . W( FIFO_W) ) fifo tx unit 
(. elk(clk) , . reset( reset), . rd(tx done tick), 
. wr( wr_uart) , . w data(w data), . empty(tx empty), 
. full(tx. full) , . r data(tx fifo out) ) ; 
uart_tx #(. DBIT( DBIT) , . SB TICK(SB TICK) ) uart tx unit 
(. elk(clk) , . reset( reset) , . tx start(tx fifo not empty) , 
. s_tick(tick) , . din(tx fifo ош), 
. ix done tick(tx done tick) , . tx(tx)) ; 
assign tx fifo not empty = -tx empty; 
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endmodule 


在 picoBlaze 源 文件 中 (第 15 章 中 ) ，Xilinx 提供 了 具有 相同 功能 的 UART 模 
块 。 和 上 述 实现 不 同 的 是 ， 该 模块 使 用 了 更 底层 的 Xilinx 原 语 。 可 以 理解 为 是 用 
Xilinx 专用 组 件 的 门 级 描述 。 因 为 设计 者 具备 关于 Xilinx 器 件 的 了 解 并 且 可 以 熟 
练 地 使 用 其 中 的 结构 ，UART 的 功能 与 本 章 中 描述 的 相 比 更 加 高 效 。 通 过 比较 两 
者 的 语言 复杂 度 及 电路 规模 大 小 是 有 借鉴 意义 的 。 


8.4.2 UART 验证 配置 


1. 验证 电路 ”我 们 使 用 一 个 回环 电路 和 一 个 PC 来 验证 UART 的 功能 。 模 块 
图 如 图 8-6 所 示 。 在 该 电路 中 ，S3 板 的 串口 与 PC 串口 相连 。 当 从 PC 中 发 出 一 
帧 数据 ， 接 收 到 的 数据 字 存 储 在 UART 接收 端 中 的 4 字 FIFO 缓存 器 中 。 在 接收 
时 (通过 r_data 端口 ) ， 数 据 字 加 1 并 返回 给 发 送 端 (通过 w_data 端口 ) 。 当 按 下 
除 闸 交换 机 的 按钮 时 ， 交 换 机 会 产生 一 个 时 钟 周期 的 激励 信号 ， 它 与 rd_uart 和 
wr_uart 相连 。 当 这 个 单 时 钟 周期 的 激励 信号 产生 时 ， 从 接收 端的 FIFO 中 读 出 一 
个 数据 帧 ， 同 时 把 这 个 数据 帧 写 入 到 发 送 端的 FIFO 中 。 例 如 ， 我 们 可 以 在 PC 
上 输入 字符 HAL， 这 样 3 个 数据 字 就 会 被 存储 在 接收 端的 FIFO 中 。 接 下 来 我 们 
连续 按 S3 板 上 的 按钮 3 次 ，IBM 三 个 数据 帧 就 会 发 送 和 显示 出 来 。UART B r- 
data 端口 也 连接 在 53 板 上 的 8 个 LED E, tx full 和 rx_empty 两 个 信号 将 会 被 连 
在 板子 上 的 七 段 显示 器 上 。 相 应 的 代码 如 示例 8. 5 所 示 。 














r data 
w data 
rd uart 

wr uart 


= я 


IX 
to PC Í 5 
按钮 开关 


rx_empty 
tx full 


UART 
图 86 一 个 UART 验证 电路 的 框图 
示例 8.5 UART 验证 电路 
moduleuart test 


( 


input wire clk, reset, 
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input wire rx, 
input wire [2: 0]btn ， 
output wire tx, 
output wire [3: 0] an, 
output wire [7: Oj]sseg, led 
)s 
// fe tz PHI 
wire tx full, rx empty, btn tick; 
wire [7: 0] тес data, rec datal ; 
// 实体 
//uart 实例 
uart uart. unit 
(. elk(clk) , . reset(reset) , . rd uart(btn tick) , 
. wr uart( btn. tick) , . rx(rx) , . w_data(rec_datal ) , 
. x full(tx full), . rx empty(rx empty), 
.r data(rec data), . tx(tx) ) ; 
// RE EPEK Ø 
debounce btn_db_unit 
(. clk(clk) . reset(reset) , .sw(btn[0]), 
. db_level( ) . db tick(btn tick) ) ; 
// 递增 数据 环 回 
assign rec_datal = rec_data + 1; 
// LED 显示 
assign led = rec_data; 
assign an 24' b1110; 
assignsseg = |l'bl, -tx full, 2'bl1, -rx empty, 3’bl11}; 


endmodule 


2. Windows 超级 终端 Windows 超级 终端 程序 可 以 作为 一 个 虚拟 终端 与 S3 
Auk, AS Ed UART 兼容 ， 需 要 配置 波 特 率 为 19 200bit/s, 8 个 数据 位 ， 
一 个 停止 位 并 且 无 校 验 位 。 基 本 步骤 如 下 : 

1) 选择“ 开始 ”一 “所 有 程序 ”一 “附件 ”一 “通信 ”一 “超级 终端 "。 显 示 一 
个 超级 终端 对 话 框 。 

2) 把 连接 命名 为 fpga_192。 单 击 “ 确 定 ”"。 这 个 连接 就 被 保存 下 来 并 且 可 以 
被 调用 。 


- 256 · 用 Verilog 设计 FPGA 样机 实例 解析 (Xilinx Spartan-3 版 ) 





3) 显示 一 个 “连接 到 "对 话 框 。 点 击 “ 连接 时 使 用 "一 栏 并 选择 需要 的 串口 
(例如 ，COM1)。 单 击 “ 确 定 ”。 

4) 显 示 一 个 端口 设置 对 话 框 。 配 置 如 下 : 

e 波 特 率 : 19 200bit/s; 

e 数据 位 : 8; 

e 校 验 位 : 无 ; 

e 停止 位 : 1; 

e 接 下 来 的 控制 : Ж; 

单 击 “ 确 定 ”。 

5 ) 选 择 “ 文 件 ” 一 “属性 ”一 “设置 "。 单 击 "ASCII 码 设置 "并 且 将 “本 地 回 显 
键入 的 字符 ” 勾 选 。 双 击 “ 确 定 ”。 这 样 就 会 在 屏幕 上 显示 输入 的 值 。 

超级 终端 程序 已 经 设置 完成 并 可 以 和 S3 板 通 信 。 我 们 可 以 键入 少量 的 字符 
然后 观察 S3 A EB LED, TER: £A FIFO 中 的 所 有 的 数据 只 有 第 一 个 字 可 以 被 
显示 。 按 "pushbutton ”这 个 键 后 ， 第 一 个 数据 帧 就 会 被 读 出 ， 这 个 字符 加 1 后 的 
字符 就 会 循环 到 PC 的 串口 端 并 且 在 超级 终端 窗口 显示 。FIFO 的 full 和 empty 两 
个 状态 可 以 通过 连续 接收 和 发 送 超过 4 个 数据 字 来 验证 。 

3. ASCH ”在 超级 终端 1 中 ,数据 字 是 通过 ASCH 码 的 方式 发 送 的 ， 它 
包含 7bit 并 且 共 有 128 个 码 : 常见 字母 、 数 字 、 标 点 符号 及 控制 字符 。 字 符 及 编 
码 (十 六 进 制 格式 ) 见 表 8-1。 非 打印 字符 如 括号 中 所 述 ， 例 如 (del) 。 一 些 非 打 
印字 符 在 接收 到 后 会 产生 如 下 效果 : 

€ (nu): BF, 全 为 0; 

(bel): 产生 铃 响 ( 如果 条 件 允 许 ) ; 
(bs): 回 格 键 backspace; 

(ht): Tab ££; 

(nl): 换行 键 ; 

(м): 垂直 键 ; 

(np): 换 页 ; 

(cr): carriage return; 


(esc): escape; 


(sp): space; NF 

e (del): 删除 键 ， 也 可 以 表示 全 1 状态 一 

Rees LEER Dc о OA S3 板 通 信 ， 以 下 几 点 有 助 于 
我 们 操作 和 处 理 ASCI 码 : | 

e. 当 第 一 个 十 六 进 制 数 为 0x0 或 0xl 时 ， 相 应 的 ASCH 码 为 控制 字符 ; 

e 当 第 一 个 干 六 进 制 数 为 0x2 或 0x3 时 ， 相 应 的 ASCII 码 为 一 个 数字 或 标点 
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符号 ; 

e 当 第 一 个 十 六 进 制 数 为 0x4 sk 0x5 时 ， 相 应 的 ASCII 码 通常 是 一 个 大 写字 
BF; 

e 当 第 一 个 十 六 进 制 数 为 0x6 sk 0x7 时 ， 相 应 的 ASCII 码 通常 是 一 个 小 写字 
BF; 

e 如 果 第 一 个 十 六 进 制 数 为 0x3 时 ， 低 位 的 十 六 进 制 数 相应 的 ASCH 2238 
常 为 十 进 制 数 ; 

e 单个 大 小 写字 母 是 有 区 别 的 ， 可 以 通过 加 (或 减 ) “0x20 "来 相互 转化 。 

注意 ASCH AA 7 位 ， 但 是 一 个 数据 字 节 通常 有 8 位 ( 即 ， 一 个 字 节 )。 
PC 使 用 一 种 扩展 设置 ， 当 最 高 位 为 1 时 ， 这 些 字符 表示 的 是 一 些 特殊 的 图 形 标 
志 。 这 种 编码 并 不 是 ASCH 码 标准 的 一 部 分 。 


8.5 定制 一 个 UART 


上 述 章节 中 介绍 的 UART 都 是 根据 特定 的 配置 来 定制 的 。 该 设计 和 代码 可 以 
通过 很 简单 的 修改 来 满足 其 他 的 需求 : 

e 波 特 率 ， 波 特 率 通过 波 特 率 发 生 器 的 采样 频率 来 控制 ， 频 率 可 以 通过 改 
变 模 m 计数 器 的 参数 M 来 改变 ; 

e 数据 位 的 个 数 ， 数 据 位 的 个 数 可 以 通过 改变 寄存 器 n_reg 的 上 限 值 来 改 
变 ， 即 改变 代码 中 常量 DBIT 的 值 ; 

e 奇偶 校 验 位 ， 校 验 位 可 以 通过 在 数据 和 停止 状态 之 间 加 如 一 个 校 验 状态 
来 实现 ， 这 个 状态 可 以 添加 在 图 8-3 中 ; 

e 停止 位 的 个 数 ， 数 据 位 的 个 数 可 以 通过 改变 寄存 器 s_reg 的 上 限 ( 常 量 SB 
_TICK) 值 来 实现 ，SB_TICK 可 以 为 16、24、32， 分 别 对 应 停止 位 的 个 数 为 1、 
Lyd, 23 

e 错误 检查 ，3 种 类 型 的 错误 可 以 在 UART 接收 子 系统 中 发 现 : 
奇偶 错误 ， 如 果 数 据 帧 中 包含 校 验 位 ， 接 收 端 可 以 检查 校 验 位 的 正确 





性 。 
一 一 帧 错误 ， 接 收 端 可 以 检查 停止 位 的 值 。 如 果 不 是 1， 那 么 这 一 帧 就 是 错 
误 的 ; 





缓存 器 数据 覆盖 错误 ， 这 种 情况 发 生 在 主 系统 没有 及 时 移出 接收 端的 数 
据 时 。UART 接收 端 可 以 检查 缓存 器 中 flag. reg 信号 或 FIFO 的 满 标志 位 ( 即 ， 当 
rx. done. tick 信号 为 1 时 ) S AL REHE fag_reg 信号 被 置 位 或 FIFO 的 满 标 
志 位 为 1 时 。 
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8.6 文献 备注 


尽管 RS-232 标准 已 经 很 经 典 了 ， 它 仍然 广泛 应 用 于 在 两 个 器 件 之 间 提 供 简 
单 、 可 靠 、 低 速率 的 通信 。Wikipedia 网 站 上 有 一 篇 很 好 的 概述 文章 和 一 些 有 用 
的 链接 (搜索 时 输入 关键 字 RS232) Jan Axelson 所 完成 的 串口 可 以 为 连接 硬件 器 
件 和 PC 提供 一 些 参考 。 


8.7 实验 


8.7.1 具备 所 有 特征 的 UART 


具有 可 选择 性 的 定制 UART 应 当 包 含 设计 中 的 所 有 特征 而 且 可 以 动态 地 根据 
需要 来 对 UART 进行 配置 。 一 个 包含 所 有 特性 的 UART 需要 使 用 额外 的 输入 来 配 
置 波 特 率 、 校 验 位 的 类 型 、 数 据 位 的 个 数 及 停止 位 的 个 数 。UART 同样 包括 错误 
信号 。 除 了 示例 8.4 中 uart_top 的 1/0 信和 号 ， 还 需要 增加 以 下 O 端口 信号 : 

ө bd rate: 输入 信号 ，2bit， 用 来 明确 波 特 率 ， 可 以 是 1200 bit/s, 2400 
bit/s, 4800 bit/s 或 9600bit/s; 

€ d num; 输入 信号 ，1bit， 用 来 明确 数据 位 的 个 数 ， 可 以 是 7 或 8; 

€ s пит: 输入 信号 ，1bit， 用 来 明确 停止 位 的 个 数 ， 可 以 是 1 或 2; 

ө par: 输入 信号 ，2bit， 用 来 明确 需要 的 校 验 位 类 型 ,可 以 是 无 校 验 位 、 
奇 校 验 位 或 偶 校 验 位 ; 

e em: 输出 信号 ，3bit， 用 来 显示 校 验 位 错误 、 帧 错误 或 数据 覆盖 。 

根据 以 下 步骤 来 生成 该 电路 : 

1) 修改 图 8-3 中 的 ASMD 图 来 满足 上 述 需 求 ; 

2) 根 据 ASMD 图 修改 UART 接收 端的 代码 ; 

3 ) 根 据 需求 修改 UART 发 送 端的 代码 ; 

4) 修 改 顶 层 UART 代码 和 验证 电路 ， 用 板子 上 的 开关 实现 增加 的 输入 ， 并 
用 3 个 LED 灯 来 代表 错误 和 输出 信号 ， 综 合 验证 电路 ; 

5 ) 在 超级 终端 程序 上 创建 不 同 的 配置 并 验证 UART 的 功能 。 


8.7.2 拥有 波 特 率 自动 检测 功能 的 UART 


最 常用 的 串 行 连接 数据 位 的 个 数 是 8 位 ， 即 一 个 字 节 。 当 我 们 用 ASCH 码 进 
行 通信 时 ( 即 ， 在 超级 终端 窗口 测试 时 ) ， 只 用 了 低 7 位 ， 而 高 位 为 0。 如 果 一 个 
UART 的 配置 为 8 位 数据 位 、1 位 停止 位 及 无 校 验 位 ， 接 收 到 的 数据 形式 如 下 : 
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0 dddd dddO 1,d 代表 数据 位 可 以 是 0 或 1。 假如 数据 帧 之 间 有 充足 的 时 间 ， 我 
们 可 以 通过 测量 第 一 个 0 和 最 后 一 个 0 之 间 的 间隔 来 确定 波 特 率 。 基 于 以 上 方 
法 ， 我们 可 以 产生 一 个 拥有 波 特 率 自动 检测 功能 的 UART。 这 样 的 话 ， 发 送 端 可 
以 先 发 送 一 个 ASCII 码 用 于 波 特 率 检测 再 继续 执行 正常 的 功能 ， 接 收 端 系统 用 第 
一 个 数据 字 来 决定 波 特 率 产 生 器 的 波 特 率 ， 从 而 进行 后 续 数 据 帧 的 传输 。 

假设 一 个 UART 的 配置 为 8 位 数据 位 、1 位 停止 位 及 无 校 验 位 ， 并 且 波 特 率 
可 以 是 4800 bit/s, 9600bit/s 或 19 200bit/s, UART 的 接收 端 应 该 有 两 种 工作 模 
式 。 开 始 在 检测 模式 ， 等 待 第 一 个 字 。 接 收 到 第 一 个 字 后 波 特 率 也 就 确定 了 ， 接 
着 接收 端 进入 正常 模式 ， 即 UART 的 功能 也 进入 一 个 正常 模式 。 根 据 以 下 步骤 来 
Ж: 

1 ) 绘 出 波 特 率 自动 检测 电路 的 ASMD 图 ; 

2) 根 据 ASMD 图 产生 VHDL 代码 , 使 用 S3 板 上 的 3 个 LED 灯 来 显示 接收 到 
信号 的 波 特 率 ; 

3) 修 改 UART， 使 其 包含 3 种 波 特 率 : 4800 bit/s、9600bit/s 及 19200bit/s。 
可 以 使 用 一 个 寄存 器 来 代表 波 特 率 的 约 数 并 且 根 据 需求 使 用 相应 的 波 特 率 ; 

4) 创 建 一 个 顶层 的 FSMD 表 来 记录 状态 ， 从 而 控制 并 整合 波 特 率 检测 电路 及 
UART 接收 端的 功能 ， 使 用 S3 板 上 的 转换 按钮 来 强制 UART 进入 检测 模式 ; 

5) 修 改 顶层 UART 代码 和 验证 电路 ， 综 合 验证 电路 ; 

6) 在 超级 终端 程序 上 创建 不 同 的 配置 并 验证 UART 的 功能 。 


8.7.3 拥有 波 特 率 校 验 位 自动 检测 功能 的 UART 


除 波 特 率 外 ， 我 们 假设 校 验 位 也 是 可 以 自动 检查 的 ， 可 以 是 无 校 验 位 、 奇 校 
验 位 或 偶 校 验 位 。 扩 展 上 面 的 波 特 率 检测 电路 来 实现 校 验 位 配置 检测 。 重 复试 验 
8.7. 24 


8.7.4 UART 控制 的 秒表 


参考 试验 4.7.6 中 增强 性 的 和 秒表， 秒表 的 功能 由 S3 板 上 的 З 个 开关 键 控制 ， 
通过 UART 串口 ， 我 们 可 以 用 PC 的 超级 终端 程序 来 发 送 命令 及 接收 秒表 的 时 
间 : 

e 当 接 收 到 一 个 e 或 C(Celear) 的 ASCH 码 时 ,秒表 终止 当前 计数 ， 清 零 ， 设 
置 计 数 方向 为 "up”; 

e 当 接 收 到 一 个 g 或 G(go) 的 ASCII 码 时 ,秒表 开始 计数 ; 

e 当 接收 到 一 个 p 或 P(pause) 的 ASCI 码 时 ,计数 暂停 ; 

e 当 接 收 到 一 个 u 或 U(up -down) 的 ASCI 码 时 ， 计 数 方向 翻转 ; 

e 当 接 收 到 一 个 r 或 R(receive) 的 ASCH Н], PRE PC 发 送 当前 时 间 ， 
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时 间 应 显示 为 "DD. D”, D 代表 十 进 制 数 ; 
e 当 接收 到 其 他 的 ASCH 码 时 ， 不 处 理 。 
设计 一 个 新 的 秒表 ， 综 合 电路 ， 连 接 PC， 用 超级 终端 程序 来 验证 功能 。 


8.7.5 UART 控制 的 LED 标语 


参考 试验 4.7.5 中 LED 移动 标语 。 通 过 UART 串口 ， 我 们 可 以 用 PC 的 超级 
终端 程序 来 控制 LED 灯 的 功能 ， 并 修改 标语 的 数字 : 

e 当 接 收 到 一 个 g 或 G(go) 的 ASCH 码 时 ，LED 开始 移动 ; 

e 当 接 收 到 一 个 p 或 P(pause) 的 ASCI FIRJ, Bah erty; 

e 当 接 收 到 一 个 d 或 D(direction) 的 ASCI 人 码 时 ,移动 方向 翻转 ; 

e 当 接 收 到 十 进 制 数字 的 ASCI 码 时 ， 标 语 将 会 被 修改 ,标语 可 以 看 作 是 
一 个 十 字 的 FIFO 缓冲 器 。 新 的 数字 将 插入 在 标语 的 开始 端 ( 即 最 左 端 ) ， 最 右 端 
的 数字 将 会 被 移出 丢弃 。 

e 当 接 收 到 其 他 的 ASCH 码 时 ， 不 处 理 ; 

设计 一 个 新 的 LED 灯 移 动 标语 ,综合 电路 ， 连 接 PC， 用 超级 终端 程序 来 验 
证 功能 。 


жож PS2 键盘 


9.1 引言 


PS2 端口 在 IBM 个 人 计算 机 的 个 人 系列 /2 中 被 引入 。 在 键盘 、 上 鼠标 与 主机 
的 通信 中 ， 它 是 一 个 被 广泛 支持 的 接口 。PS2 端口 使 用 两 条 线 进 行 通信 。 一 条 是 
串 行 传输 的 数据 线 ， 另 一 条 传输 时 钟 信息 ， 此 信息 详细 指出 何 时 数据 有 效 及 何 时 
可 以 接收 数据 。 此 时 钟 信 息 以 包含 一 个 起 始 位 ，8 个 数据 位 ， 一 个 奇偶 校 验 位 和 
一 个 停止 位 的 11 -位 包 ”的 方式 进行 传输 。 虽 然 一 个 键盘 和 鼠标 的 包 的 基本 格 
式 是 相同 的 ,但 是 它们 的 数据 位 的 解释 却 不 一 样 。FPGA 的 原型 板 有 一 个 PS2 Ўй 
口 并 作为 主机 被 使 用 ， 在 这 章 中 我 们 将 讨论 键盘 接口 并 在 第 10 章 中 讨论 鼠标 接 
口 。 

PS2 端口 的 通信 是 双向 的 ， 主 机 可 以 向 键盘 和 和 鼠标 发 送 指令 ， 用 来 设置 特定 
参数 。 对 我 们 的 目的 而 言 ，PS2 键盘 的 双向 通信 和 是 不 需要 的 ， 因 此 我 们 只 讨论 从 
键盘 到 原型 板 的 单方 向 通信 。 双 向 的 设计 在 第 10 章 的 鼠标 接口 中 考察 。PS2 端 
日 的 时 序 图 如 图 9-1 所 示 。 





1 і 
数据 (ps2d) | d 
| I 


I š 
数据 (ps2c) ГОП 


图 9-1 PS2 端口 的 时 序 图 
9.2 PS2 接收 子 系统 


9.2.1 PS2 端口 的 物理 层 接口 


除了 数据 线 和 时 钟 ，PS2 端口 还 包括 与 电源 ( 即 ，Vec) 和 地 相连 的 线 。 电 源 
由 主机 提供 。 最 初 的 PS2 端口 ，Vec 是 5V， 数 据 输 出 线 和 时 钟 是 开放 的 收集 器 。 
但 是 ， 现 在 大 部 分 的 键盘 和 鼠标 都 可 以 在 3.3V 的 电压 下 正常 工作 。 对 于 一 个 老 
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版 的 键盘 和 鼠标 ， 可 以 通过 转换 S3 板 上 的 J2 跳 线 得 到 SV 的 电压 。 由 于 FPGA 
的 LO 引 脚 可 以 承受 SV 的 输入 ， 所 以 FPGA 仍 能 正常 地 运行 。 


9.2.2 设备 到 主机 的 通信 协议 


PS2 设备 和 主机 通过 包 进 行 通信 。 从 PS2 设备 到 主机 的 传输 时 序 图 如 图 9-1 
所 示 ， 图 中 数据 和 时 钟 信号 分 别 标 为 ps2d 和 ps2c。 

数据 以 串 行 模式 进行 传输 ， 格 式 与 ПАКТ 相似 。 传 输 以 一 个 起 始 位 开始 ， 接 
着 是 8 个 数据 位 和 一 个 奇偶 校 验 位 ， 最 后 是 一 个 停止 位 。 与 UART 不 同 ，PS2 的 
时 钟 信息 是 在 一 个 单独 的 时 钟 信号 (ps2c) 上 传输 。ps2e 信号 的 下 降 沿 表示 ps2d 
上 的 相应 位 有 效 ， 并 可 以 得 到 此 位 数据 。ps2e 信号 的 时 钟 周期 应 在 60 ~ 100hs 
之 间 (10 ~ 16. 7kHz) ， 并 且 ps2d 信号 在 ps2e 信号 的 下 降 沿 前 后 至 少 Sus 内 应 保 
持 稳 定 。 


9.2.3 设计 和 代码 


PS2 端口 的 接收 子 系统 的 设计 有 点 类 似 UART 接收 器 的 设计 。ps2e 信号 的 下 
降 沿 作为 返回 数据 的 参考 点 ， 代 替 了 过 采样 策略 。 子 系统 包含 一 个 检测 下 降 沿 的 
电路 ， 它 在 ps2c 信和 号 的 下 降 治 产生 一 个 单 时 钟 周期 的 脉冲 ， 同 时 接收 器 移 人 并 
重新 装配 串 行 数据 。 

在 第 5. 3. 1 节 中 讨论 的 边沿 检测 电路 可 以 被 用 来 检测 下 降 沿 并 生成 一 个 使 能 
脉冲 。 然 而 ， 由 于 存在 潜在 噪声 和 跳 变 延迟 的 情况 ， 所 以 需要 增加 一 个 简单 的 滤 
波 电路 用 于 除去 干扰 脉冲 。 这 个 滤波 器 的 代码 如 下 : 

always @ ( posedge clk, posedge reset) 


filler reg <= filter next; 


//1 - bit EMRE 
assign filter next = | ps2c, filter reg[ 7: 11]; 
// “Et UR GE” 
assign f ps2c next = (filter_reg = =8’b11111111) ?1’bl; 
(filter reg = =8’ b00000000) ? 1” b0; 
f ps2c reg; 
这 个 电路 由 一 个 8 位 的 移 位 寄存 器 构成 ， 在 接收 到 连续 的 8 个 1 或 者 0 的 时 候 返 
回 一 个 1 或 0。 任何 一 个 比 8 个 时 钟 周期 短 的 干扰 脉冲 都 将 被 忽略 掉 。 接 着 ， 滤 
波 器 的 输出 信号 会 反馈 给 下 降 沿 检测 电路 。 
接收 器 的 ASMD 图 如 图 9-2 所 示 。 接 收 器 在 Idle 状态 时 被 初始 化 。 接 收 器 包 
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含 一 个 额外 的 控制 信号 ，rx_en， 它 常 被 用 来 使 能 (或 者 不 使 能 ) 接收 操作 。 这 个 
信号 的 目的 是 协调 双向 操作 。 对 于 键盘 接口 ， 它 被 置 为 1。 
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rx done tick-l 


图 9-2 PS2 接收 端口 的 ASMD 图 


在 第 一 个 下 降 沿 脉冲 到 来 后 ，mx_en 信号 被 置 为 有 效 ，FSMD 移入 开始 位 并 
转换 到 dps 状态 。 由 于 接收 的 数据 有 固定 格式 ， 因 此 可 以 在 一 个 单独 的 状态 中 移 
10 位 而 不 用 将 数据 、 奇 偶 和 停止 状态 分 开 。 接 着 ，FSMD 转换 到 加 载 状态 ， 在 这 
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个 状态 中 ， 提 供 一 个 额外 的 时 钟 周期 用 于 完成 停止 位 的 移 位 ， 在 这 个 周期 中 psrx 
_done_tick 信号 被 置 为 有 效 。HDL 代码 包含 滤波 器 电路 和 一 个 FSMD 两 部 分 ， 它 
遵循 图 9-2 的 ASMD 图 。HDL 代码 如 示例 9. 1 所 示 。 

示例 9. 1 PS2 接收 端口 


module ps2 rx 
( 
input wire clk, reset, 
input wire ps2d, ps2c, rx en, 
output reg rx done tick, 
output wire [7: 0] dout 
); 
// 符号 状态 声明 
localparam [1: 0] 
idle =2’ b00, 
dps -2' b01, 
load =2’ b10; 
ПЕ 
reg [1: 0] state reg, state next; 
reg (7: 0] filter reg; 
wire [7: 0] filter next; 
reg f ps2c reg; 
wire f ps2c next; 
reg [3: 0] n reg, n next; 
reg [10: 0] b reg, b next; 
wire fall edge; 
// 实体 


always € ( posedge clk, posedge reset) 
filter reg <= filter next; 
//lbit £fz$& 
assign filter next = | ps2c, filter reg[7: 1]|; 


// “SE 8 a” 
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assign f ps2c next = (filter reg = 28' b11111111) ? I' bl : 
(filler reg = 28' b00000000) ? 1' bO : 
f ps2c reg; 

assign fall edge 2f ps2c reg & ~ Ё ps2c next; 


// FSMD 状态 和 数据 寄存 天 
always @ ( posedge clk, posedge reset) 
if ( reset) 
begin 
state reg «- idle; 
n reg <=0; 
b reg <=0; 
end 
else 
begin 
state reg «-state next; 
n reg «-n next; 
b reg «-b next; 
end 
// FSMD iE fH 
always @ +* 
begin 
state next —state reg; 
rx done tick 21" b0; 
n next -n reg; 
b next = b reg; 
case (state reg) 
idle: 
if (fall edge & rx en) 
begin 
// 在 转移 起 始 位 
b next = | ps2d, b reg[ 10; 1]}; 
n next =4’ b1001 ; 


- 266 - 用 Verilog 设计 FPGA 样机 实例 解析 (Xilinx Spartan-3 版 ) 





state next = dps; 
end 
dps: //8 数据 位 +1 arp {Л 1 停止 位 
if (fall edge) 
begin 
b next = | ps2d, b reg[ 10: 1]}; 
if (n reg 2-20) 
state next = load; 
else 
n next = п reg-l; 
end 
load: //1 个 额外 的 时钟 未 完成 最 后 一 次 移 位 
begin 
state_next = idle; 
rx done tick =1’ bl; 
end 
endcase 
end 
// 输出 
assign dout = b_reg[8: 1]; // 数据 位 
endmodule 


以 上 描述 了 没有 错误 监测 的 电路 。 更 鲁 棒 的 设计 应 检查 开始 位 、 奇 偶 位 、 停 
止 位 ， 并且 应 当 包 含有 监视 时 钟 从 而 防止 键盘 锁 死 在 一 个 错误 的 状态 。 这 在 本 章 
最 后 被 留 作 实 验 。 


9.3 PS2 键盘 的 扫描 码 


9.3.1 扫描 码 概述 


键盘 由 一 个 按键 矩阵 和 一 个 戏 人 式微 型 控制 器 组 成 ， 这 个 微型 控制 器 监听 
(Вр, 扫描) 按键 的 动作 ， 并 因此 发 出 扫描 码 。 以 下 三 种 类 型 的 按键 动作 会 被 监 
ШЕР 

e 当 按键 按 下 的 时 候 ， 输 出 按键 的 建立 码 ; 

e 当 按 键 持续 保持 按 下 状态 时 ， 此 情况 被 识别 为 连续 键入 ， 以 一 定 的 频率 
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重复 输出 建立 码 ， 默 认 情 况 下 ，PS2 键盘 在 按键 保持 按 下 0. 5s 后 每 100ms 输出 
建立 码 ; 

e 当 按 键 被 释放 时 ， 输 出 按键 的 停止 码 。 

PS2 键盘 主要 部 分 的 建立 码 如 图 9-3 所 示 。 它 通常 为 1 字 节 的 宽度 ， 并 且 用 
两 个 十 六 进 制 的 数 表示 。 例 如 ，A 按键 的 建立 码 为 1C。 在 传输 的 时 候 ， 这 个 码 
将 通过 一 个 包 进 行 传递 。 少 数 具 有 特殊 意义 的 按键 ( 即 扩展 按键 ) 的 建立 码 ， 可 
以 有 2 ~4 字 节 。 这 些 按键 的 一 部 分 如 图 9-3 所 示 。 例 如 ， 右 侧 的 向 上 键 的 建立 
码 是 E075。 需 要 多 个 包 来 传输 。 一 般 按键 的 停止 码 由 FO 后 跟 按 键 的 建立 码 组 
成 。 例 如 ， 按键 A 的 停止 码 为 F01C。 


ESC F5 || F6 || F7 || F8 F9 F11 || F12 t 
76 03 J| oB J| 83 || OA 01 78 || 07 E075 
1! ||2@ 4$ ||5% || 6^ || 7& || 8* 9( 0) =+ ||Back Spac = 
16 J| 1E 25 JL 25 J| 36 || зр || зе || 46 || 45 55 J| 66 E074 
ТАВ ][ Q ][ W R] T ])[ Y] Г 1} \ + 
ор 15 || 1р 20 || 2c || 35 || зс || 43 5B 5D z068 
KXHHHHHHHHBBHPIE 
а 1с || 1B || 23 33 EX 4B || 4C € 5A 
F: 7? 4 Shift 
F: H H M m M а u 4A 59 
a) [= 
14 5 [. _ *- „| E011 z014 


99-3 PS2 键盘 的 扫描 编码 


PS2 键盘 根据 按键 的 行为 输出 一 个 码 的 序列 。 例 如 ， 当 我 们 按 下 并 释放 按键 
A 时 ， 键 盘 先 输出 建立 码 ， 接 着 输出 停止 码 。 

IC FO 1С 

如 果 我 们 按 下 按键 并 在 保持 一 段 时 间 后 释放 ， 建 立 码 将 被 输出 多 次 : 

IG 1C 1C-1C F0 1€ 

多 个 按键 可 以 同时 被 按 下 。 例 如 ， 我 们 先 按 下 “Shift" 键 ( 它 的 建立 码 是 12)， 
Hr, 按 下 "A” 键 ， 然 后， 释放 “ A" 键 ， 释 放 “Shift” 键 。 输 出 码 的 序列 遵循 两 个 
按键 的 建立 码 和 停止 码 : 

12 1C FO 1C FO 12 

上 述 序列 是 我 们 怎样 正常 的 获得 大 写字 母 A。 需 要 注意 的 是 ， 没 有 用 来 区 别 
小 写 或 大 写 键 的 码 。 由 主 设备 负责 跟踪 “Shift” 键 是 否 已 经 按 下 ， 并 根据 此 情况 决 
定 是 哪个 事件 。 


9.3.2 扫描 码 监 听 电 路 
扫描 码 监 听 电 路 监听 接收 包 的 到 达 并 在 PC 的 超级 终端 窗口 显示 扫描 码 。 基 
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本 的 设计 方法 是 首先 将 接收 的 扫描 码 分 解 为 两 个 4 位 ， 并 将 它们 看 作 是 两 个 十 六 

进 制 的 数 ， 接 着 ， 将 两 个 数 转 换 为 ASCI 码 值 ， 并 将 ASCII 码 通过 UART 发 送 给 

PC。 接 收 到 的 扫描 码 将 像 先前 例子 中 的 序列 一 样 被 显示 。 程 序 如 示例 9. 2 所 示 。 
示例 9.2 PS2 键盘 扫描 编码 的 监听 电路 


module kb_monitor 
input wire clk, reset, 
input wire ps2d, ps2c, 
output wire tx 
) $ 
// 常量 声明 
localparam SP = 8' h20; // ASCII 空间 
// 符号 状态 声明 
localparam [1: 0] 
= ide  -2'b00, 
sendl =2”Ь01, 
send0 =2’ b10, 
sendb =2 b11; 
// fi tr pH] 
reg [1: 0] state reg, state next; 
reg [7: 0] w data, ascii code; 
wire [7: 0] scan data; 
reg wr uart; 
wire scan done tick; 
wire [3: 0] hex in; 


// PS2 BI as Si: fn] 

ps2 rx ps2 rx unit 
(. elk(clk) , . reset(reset) , . rx en(1' bl), 
. ps2d( ps2d) , . ps2c(ps2c) , 


. rx done. tick(scan done, tick) , . dout( scan, data) ) ; 
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//UART 实例 

uart uart unit 
(. elk(clk) , . reset(reset) , . rd uart(1' ЬО), 
. wr. uart( wr uart) , . rx(1' bl), . м data(w data), 
. tx full() , . rx етріу(), .r data(), . tx(tx)); 


// 状态 寄存 加 
always @ ( posedge clk, posedge reset) 
if ( reset) 
state reg <= idle; 
else 
state reg <= state next; 
// КУ 
always (2 * 
begin 
wr uart 21' b0; 
w. data = SP; 
state next = state reg; 
case (state reg) 
idle: 
if (scan. done tick) // ЩЧ 
state next = sendl ; 
send] ; // 发 送 高 十 六 进 制 数字 
begin 
w_data = ascii_code; 
wr. uart =1’ bl; 
state next = sendO ; 
end 
send0 ; // 发 送 低 十 六 进 制 数字 
begin 
w. data = ascii code; 
wr uart =1’ bl; 


state next = sendb; 
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end 
sendb: — // 发 送 空 白字 符 
begin 
w. data = SP; 
wr uart =1’ bl; 
state next = idle; 
end 
endcase 
end 
ZZ 二 一 一 一 一 一 一 一 一 一 二 一 二 二 二 二 一 一 二 一 一 一 一 二 一 二 二 三 一 一 一 一 一 二 一 一 一 一 二 三 三 三 三 三 二 二 一 
// filf4s|ASCI 显示 
if SSeS SS SS eei 


// ВАННА PAT fz Nt dl 
assign hex in = ( state reg == sendl ) ? scan_data[7: 4] : 
scan data[ 3: 0]; 
// 十 六 进 制 数字 到 4SCIT £5 
always @ +* 
case (hex_in) | 
4' h0; ascii code =8'h30; 
4' hl; ascii code 28' h31; 
4'h2; аѕсіі code =8’ h32; 
4' h3; ascii code =8’ h33; 
4'h4; ascii code =8’ h34; 
4'h5; ascii code =8’ h35; 
4' h6; ascii code =8’ h36; 
4' h7; ascii code =8’ h37; 
4' h8; ascii code =8’ h38; 
4' h9; аѕсіі code =8’ h39; 
4'ha; ascii code 28' h41; 
4' hb: аѕсіі code =8’ h42; 
4'he; ascii code =8’ 43; 
4' hd; ascii code =8’ h44; 
4'he; ascii code =8’ h45; 
default: ascii code =8’ h46; 
endcase 
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endmodule 


使 用 FSM 来 控制 全 部 的 操作 。 当 接收 到 一 个 新 的 扫描 码 (通过 将 sean. done 
tick 信和 号 置 为 有 效 表 示 ) 时 ， 启 动 UART 操作 。FSM 在 sendl 、send0 和 sendb 状态 
之 间 循 环 ， 在 这 些 状态 中 将 大 写 十 六 进 制 数 ， 小 写 十 六 进 制 数 和 空格 的 АЅСП 码 
写 入 UART。 上 章 介 绍 UART 有 一 个 四 字 的 FIFO0， 因 此 不 会 产生 溢出 。 注 意 , 不 
使 用 UART 的 接收 器 ， 响 应 端口 被 映射 到 常量 或 者 被 留 空 。 


scan_out 


ps2c ps2c dout is z key_code 
ps2d ps2d . code ti rd key code 
clk 一 一 rx_done tick l kd buf empty 






FSM 获得 最 后 
扫描 码 


ps2 rx 


图 94 键盘 最 后 一 个 释放 键 电路 的 结构 图 


9.4 Р52 键盘 接口 电路 


正如 9.3.1 节 所 讨论 的 ， 即 使 是 简单 的 键盘 行为 ， 也 会 发 送 一 个 包 的 序列 。 
如 果 我 们 想 要 覆盖 所 有 可 能 的 组 合 ， 将 会 变 得 非常 复杂 。 在 这 一 节 中 ,我们 假设 
一 次 只 按 下 和 释放 一 个 常规 键 ， 并 设计 一 个 电路 返回 这 个 键 的 建立 码 。 这 个 设计 
提供 了 向 原型 板 发 送 一 个 字母 或 数字 的 简单 方法 。 


9.4.1 基本 设计 与 HDL 代码 


键盘 电路 与 UART 相同 是 一 个 系统 的 外 围 电路 ， 它 需要 一 个 与 主 系统 通信 的 
装置 。 已 在 第 8. 2. 4 节 中 讨论 的 标志 和 缓存 结构 同样 可 以 用 在 键盘 电路 中 。 在 这 
个 设计 中 ， 我 们 使 用 一 个 四 字 的 FIFO 作为 接口 。 

顶层 的 示意 图 如 图 94 所 示 。 它 由 PS2 接收 器 、FIFO 缓存 和 FSM 控制 
器 组 成 。 基 本 想法 是 使 用 FSM 追踪 FO 包 的 停止 码 。 在 它 被 接收 后 ， 下 一 个 
包 应 是 这 个 键 的 建立 码 ， 这 个 包 将 被 写 人 FIFO 缓存 器 。 注 意 ， 这 个 结构 不 
能 用 于 扩展 键 ， 因 为 它们 的 建立 码 包含 多 个 包 。 相 应 的 HDL 代码 如 示例 9.3 
所 示 。 
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示例 9.3 PS2 键盘 最 后 一 个 释放 键 的 电路 


module kb_code 
#( parameter W SIZE -2)  //FIFO 中 存储 2 "^" <s 
( 
input wire clk, reset, 
input wire ps2d, ps2c, rd key code, 
output wire [7: 0] key code, 
output wire kb buf empty 
J5 
// REH 
localparam BRK -8' hf0; // Bri 
// 符号 状态 声明 
localparam 
wait_brk =1’ b0, 
get code =1’ bl; 
// EUH 
reg state reg, state next; 
wire [7: 0] scan out; 
reg got code tick ; 
wire scan done tick; 


// 实体 


// PS2 Ийт 0] 
ps2 rx ps2 rx unit 

(. elk(clk) , . reset(reset) , . rx en(1' bl), 

. ps2d( ps2d) , . ps2c(ps2c) , 

.rx done tick( scan, done tick) , . dout( scan. out) ) ; 
// tito BAF GEE fh] 
fifo #(. B(8), . W(W SIZE)) fifo_key_unit 

(. elk(clk) , . reset(reset) , . rd(rd key code), 
. wr(got code бск), . w data(scan out), 


. empty( kb buf empty) , . full( ) , 
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. r data( key code) ) ; 


// s BE AF E 
always @ ( posedge clk, posedge reset) 
if ( reset) 
state reg <= wait brk; 
else 
state reg «-state next; 
// om dn 
always (9 * 
begin 
got code tick 21" b0; 
state next — state reg; 
case (state reg) 
wait brk: — // Sf FO ВН 
if (scan done tick = 21' bl && scan out = = BRK) 
state next = get code; 
get code; — // {#0 PAGE 
if ( scan. done. tick ) 
begin 
got code tick =1 bl; 
state next = wait. brk; 
end 
endcase 
end 
endmodule 


代码 的 主要 部 分 是 FSM， 它 用 来 扫描 停止 码 ， 并 协调 两 个 模块 的 操作 。 它 
在 wait. brk 状态 连续 地 检测 接收 到 的 包 。 当 检查 到 FO 包 后 ， 转 到 get. code 状态 
并 等 待 下 一 个 包 〈 它 是 这 个 键 的 建立 码 ) 。 接 着 ， 在 一 个 时 钟 周期 内 FSM 将 code 
.done tick 信号 置 为 有 效 ， 并 返回 wait_brk 状态 。 
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9. 4. 


结构 


2 验证 电路 


我 们 设计 一 个 简单 的 串 行 接口 和 译 码 电路 来 验证 PS2 键盘 接口 的 操作 。 顶 层 
示意 图 如 图 9-5 所 示 。 电 路 将 键 的 建立 码 转换 为 相应 的 ASCI 码 ， 并 将 


ASCII 码 送 到 UART。 相 应 的 字符 和 数字 可 以 在 超级 终端 窗口 中 显示 。 转 换 电 路 


fH 


DL 代码 如 示例 9. 4 所 示 。 


ps2c 
keycode >. 
ps2d — pea КӘ UL 
Ke bat жау | 


kb_key_code 


tx(to PC) 





kb_not_empty 


kb_code 


图 9-5 键盘 验证 电路 的 框图 


示例 9.4 键盘 的 建立 码 对 应 的 ASCII 15 


module key2ascii 


h 


input wire [7:0] key code, 
output reg [7: 0] ascii code 


always) * 


case( key. code) 


8’h45: ascii code -8'h30; //0 
8'hl6; ascii colez8'h31;  //1 
8'hle; ascii code-8'h32; // 2 
8'h26; ascii code-8'h33;  //3 
8'h25; ascii code-8'h34; // 4 
8’ h2e: ascii code-8'h35;  //5 
8'h36; ascii code -8'h36;  //6 
8'h3d: ascii code 28' 37;  //7 
8'h3e: ascii code -8' h38; // 8 
8'h46: ascii code =8’ h39; 4/9 
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8' hlc: 
8' h32; 
8'h21; 
8' h23: 
8' h24; 
8' h2b; 
8' h34; 
8' h33: 
8' h43; 
8' h3b; 
8’ h42; 
8’ h4b: 
8’ h3a; 
8' h31; 
8' h44; 
8' hád; 


8' his 


ascii code = 8 ' 41; 
ascii code = 8° h42; 
ascii code = 8° 43; 
ascii_code = 8° 44; 
ascii code = 8° h45; 
ascii code = 8° h46; 
ascii code = 8' h47; 
ascii code = 8' h48; 
ascii code =8’ h49; 
ascii code 28' h4a; 
ascii code =8’ h4b; 
ascii code =8’ h4c; 
ascii code =8’ h4d; 
ascii code =8’ h4e; 
ascii code = 8° h4f; 
ascii code = 8' h50; 


; аѕсіі code 2 8' h51; 
8' h2d: 
8'hlb: 
8' h2c; 
8' h3c: 
8' h2a; 
8' hid; 
8' h22; 
8' h35; 
8' hla: 
8' hOe: 
8’ h4e: 
8' h55; 
8' h54: 
8' h5b; 
8' h5d: 
8' hác: 
8' h52; 
8'h4l; 


ascii code =8 h52; 
ascii code = 8’ h53; 
ascii code = 8' h54; 
ascii code =8’ h55; 

ascii code =8’ h56; 

ascii code = 8' 57; 
ascii code =8’ h58; 
ascii code =8 h59; 
ascii code =8’ h5a; 

ascii code = 8' h60; 
ascii code =8’ h2d; 
ascii code =8° h3d; 
ascii code =8° h5b; 
ascii code =8’ h5d; 
ascii code =8 h5c; 
ascii code =8 h3b; 
ascii code =8 h27; 


ascii code =8’ h2c; 


// À 

// B 
// С 
// р 
// E 
// F 
// б 
//H 
Hp d 

// J 
//K 
// 1, 
// M 
// N 
//0 
// P 
// 0 
//R 
// 8 
HM 
// U 
// V 
// W 
HX 
^l Y 
// 7 
ths 

Ў? = 
"I 
ZFT 
// ] 
// \ 

A a 

А 

// 


, 
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8'h49; ascii_code =8'h2e; //. 
8’ h4a: ascii code =8'h2f; /// 
8'h29; ascii code 28'h20; // (space ) 
8'h5a; ascii code 28'hO0d; // (enter, сг) 
8'h66: ascii code 28'h08; // (backspace ) 
default; ascii code 28' h2a; // * 
endcase 
endmodule 


验证 电路 的 全 部 代码 遵循 图 9-5 中 的 结构 示意 图 , 它 的 代码 如 示例 9.5 所 示 。 
示例 9.5 键盘 验证 电路 


module kb_test 
( 
input wire clk, reset, 
input wire ps2d, ps2c, 
output wire tx 
3 
// 信号 声 盟 
wire [7: 0] key code, ascii code; 
wire kb not empty, kb buf empty; 
// ЖЖ 
// KARI ERHI А A 
kb_code kb_code_unit 
(. clk(clk), . reset(reset) , .ps2d(ps2d), . ps2c( ps2c), 
. rd key code(kb not empty), . key code(key. code), 
. kb. buf empty( kb buf empty) ) ; 
//UART 实例 
uart uart_unit 
(. elk(clk) , .reset(reset), .rd_uart(1'b0), 
. wr uart( kb. not. empty) , . rx(1' bl), . w data(ascii code), 
. tx full() , . rx empty(), .r data() , . tx(tx)); 
// f SI ASCI 但 转换 电路 实例 
key2ascii k2a_unit 


(. key. code( key. code) , . ascii, code( ascii code) ) ; 
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assign КЬ not empty = ~ kb buf empty; 


endmodule 


9.5 文献 备注 


Adam Chapweske ‘5 ff) (PS/2 鼠标 /键盘 协议 》, (PS/2 键盘 接口 》 和 《PS/2 Bil 
标 接口 》 三 篇 文章 ， 提 供 了 键盘 和 鼠标 接口 的 详细 内 容 。 这 些 内 容 可 以 在 ht- 
tp: //www. computer-engineering. org 网 站 找到 。 数 字 系 统 的 高 速 原型 : 在 PS2 端 
口 与 键盘 和 鼠标 协议 上 ，James 0. Hamblen 的 《Quartus@ II Edition》 也 包含 了 一 


E. 
9.6 实验 


9.6.1 可 选 的 键盘 接口 I 


TE 9.4 节 中 的 接口 电路 返回 最 后 一 个 释放 键 的 建立 码 ， 因 而 忽略 了 连续 键 人 
情况 。 可 选 的 方法 是 考虑 连续 键 和 情况。 当 一 个 键 保持 按 下 状态 时 ， 键 盘 接 口 电 
路 应 该 重复 返回 按键 的 建立 码 并 忽略 最 后 的 停止 码 。 为 了 简单 ， 我 们 假设 没有 使 
用 扩展 键 。 设 计 新 的 接口 电路 ， 重 新 综合 验证 电路 ， 并 检验 新 接口 电路 的 操作 。 


9.6.2 可 选 的 键盘 接口 I 


我 们 可 以 扩展 接口 电路 ， 使 它 可 以 分 辨 ”Shift”" 键 是 否 按 下 ， 从 而 使 小 写 和 大 
写字 母 都 可 以 键入。 扩展 电路 可 进行 如 下 改进 : 

e 输出 键 码 可 以 从 8 位 扩展 到 9 位 。 额 外 的 位 表示 移 位 键 是 否 保持 按 下 ; 

e FSM 应 增加 一 个 专用 的 分 支 用 来 处 理 “Shift” 键 的 建立 和 停止 码 ， 并 据 此 
设置 相应 位 的 值 ; 

e FIFO 缓存 器 的 宽度 应 扩展 到 9 位 。 

设计 扩展 接口 电路 ， 改 进 key2ascii 电路 来 处 理 小 写 和 大 写字 母 ， 重 新 综合 
验证 电路 ， 并 检验 扩展 接口 电路 的 操作 。 


9.6.3 带 看 门 狗 定 时 器 的 PS2 接收 子 系统 


9.2 节 中 的 PS2 的 接收 子 系统 没有 容错 能 力 。ps2c 信号 的 潜在 噪声 和 干扰 脉 
冲 可 能 会 引起 FSMD 进入 错误 的 状态 。 解 决 问题 的 一 个 方法 是 添加 看 门 狗 定时 
器 。 每 次 信号 fall edge tick 在 状态 get. bit 中 被 置 为 有 效 时 ， 初 始 化 定时 器 。 如 
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果 在 下 一 个 20ps 内 没有 新 的 下 降 沿 到 达 ， 信 号 time_out 被 置 为 有 效 ， 并 且 FSMD 
回 到 idle 状态 。 设 计 改进 的 接收 子 系统 ， 生 成 一 个 测试 平台 ， 并 使 用 仿真 检验 它 
的 操作 。 


9.6.4 键盘 控制 的 秒表 


思考 实验 4.7.6 中 的 增强 型 秒表 。 在 原型 板 上 有 З 个 开关 控制 秒表 的 操作 。 
我 们 可 以 使 用 键盘 向 秒表 发 送 命令 : 

e 当 C 键 (表示 “清除 ”) 被 按 下 ， 秒 表 中 断 现 有 的 操作 ， 清 零 ， 并 将 计 
数 器 方向 设置 为 “向 上 ”; 

e 当 G 键 (表示 “运行 ") 被 按 下 ， 秒 表 开 始 计数 ; 

e "PS (表示 “和 暂停") 被 按 下 ,停止 计数 ; 

e 当 U 键 (表示 “向 下 ”) 被 按 下 ， 秒 表 反 方向 计数 ; 

e 忽略 所 用 其 他 按键 。 

设计 新 码 表 ， 综合 电路 并 检验 它 的 操作 。 


9.6.5 键盘 控制 的 移动 LED 横幅 


参考 实验 4.7.5 中 的 移动 LED 横幅 电路 。 我 们 可 以 使 用 键盘 来 控制 它 的 操 
作 并 动态 的 更 改 横幅 中 的 数字 。 

e "4 G #Ë (表示 “运行 ") 按 下 的 时 候 ，LED 横幅 开始 移动 ; 

e 当 P 键 (表示 “停止 ") 按 下 的 时 候 ，LED 横幅 停止 移动 ; 

e 当 D 键 (表示 “方向 ") 按 下 的 时 候 ，LED 横幅 反 向 移动 ; 

e 当 一 个 十 进 制 的 数字 键 Cp, 0, 1, =, 9) 按 下 的 时 候 ， 横 幅 会 被 改 
变 ， 横 幅 可 以 被 看 为 是 一 个 10 字 的 FIFO 缓存 器 ， 新 的 数字 会 插入 到 横幅 的 最 前 
面 ， 并 且 移出 丢弃 最 左边 的 数字 ; 

e 忽略 所 有 其 他 的 键 。 

设计 新 的 移动 LED 横幅 电路 ， 综 合 电路 ， 并 检验 它 的 操作 。 


第 10 PS2 鼠标 


10.1 引言 


计算 机 的 鼠标 主要 被 设计 用 于 在 平面 上 探测 二 维 空间 中 的 运动 。 它 内 部 的 电 
路 测量 运动 的 相对 距离 和 检查 按钮 的 状态 。 对 于 一 个 PS2 接口 的 鼠标 ， 这 些 信息 
被 封装 在 3 个 数据 包 里 ， 然 后 通过 PS2 端口 发 送 到 主机 。 在 流 模式 下 ， 一 个 PS2 
接口 的 鼠标 可 以 在 预先 设 定 的 采样 速率 下 连续 地 发 送 包 。 

PS2 端口 的 通信 是 双向 的 ， 主 机 能 够 发 送 命令 到 键盘 或 鼠标 去 设置 某 些 参 
数 。 从 我 们 的 角度 出 发 ， 这 些 功 能 对 键盘 来 说 几乎 是 不 需要 的 ， 在 第 9 章 中 的 
这 种 键盘 接口 只 限于 从 键盘 到 FPGA 主机 一 个 方向 的 通信 。 然 而 ， 不 像 键 盘 ， 
鼠标 在 上 电 后 被 设置 在 非 连续 模式 下 并 且 没 有 发 送 任何 数据 。 主 机 首先 要 发 送 
一 条 命令 给 鼠标 去 初始 化 鼠标 并 使 能 连续 模式 。 因 此 ，PS2 端口 的 双向 通信 是 
PS2 鼠标 接口 所 需要 的 ， 我 们 必须 为 PS2 接口 设计 一 个 传输 子 系统 (从 FPGA 
板 到 鼠标 ) 。 

- 在 本 章 ， 我 们 会 提供 一 个 PS2 鼠标 协议 的 简略 总 结 ， 设 计 一 个 双向 的 PS 接 
口 ， 并 得 到 一 个 简单 的 鼠标 接口 。 


10.2 PS2 鼠标 协议 


10.2.1 基本 操作 


标准 的 PS2 鼠标 会 报告 * 轴 ( 右 / 左 )、y 轴 ( 上 AT 下) 的 运动 和 左 侧 按 钮 、 中 间 
按钮 、 右 侧 按钮 的 状态 。 每 次 移动 量 的 大 小 被 记录 在 鼠标 内 部 的 计数 器 中 。 在 数 
据 发 送 到 主机 的 时 候 ， 计 数 器 就 会 清 零 且 重 新 开始 计算 。 计 数 器 的 内 容 用 一 个 9 
位 的 有 符号 整 型 表示 ， 正 数 表示 向 右 或 向 上 的 运动 ， 负 数 表示 向 左 或 向 下 的 运 
动 。 

物理 距离 之 间 的 关系 是 通过 鼠标 的 灵敏 度 参 数 来 定义 。 灵 人 敏 度 默 认 值 是 4 个 
计数 每 毫米 。 在 鼠标 连续 地 运动 的 时 候 ， 数 据 在 规定 的 速率 下 发 送 。 速 率 是 通过 
鼠标 采样 速率 参数 来 定义 。 采 样 速率 的 默认 值 是 每 秒 采样 100。 如 果 鼠 标 运动 速 
度 太 快 ， 在 采样 周期 期 间 移动 量 的 大 小 可 能 超过 计数 器 的 最 大 范围 。 计 数 器 在 适 
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当 的 方向 上 设置 成 最 大 值 。 两 个 溢出 位 标识 了 这 种 情况 。 

通过 3 字 节 数据 鼠标 能 报告 它 的 运动 和 按钮 的 行为 ， 它 垦 入 在 3 个 PS2 数据 
包 中 。3 字 节 数据 的 详细 格式 在 表 10-1 中 进行 说 明 。 它 包含 以 下 信息 : 

e xs, `, Xo: 用 二 进 制 补 码 表示 沿 x 轴 的 运动 ; 

е x,: x 轴 运动 的 溢出 值 ; 

ө ys, `“, Yor 用 二 进 制 补 码 表示 沿 y 轴 的 运动 ; 

e y,: y 轴 运 动 的 溢出 值 ; 

e |; 左 侧 按钮 的 状态 ， 在 左 侧 按钮 进行 按压 的 时 候 它 是 1; 

e r: 右 侧 按钮 的 状态 ， 在 右 侧 按钮 进行 按压 的 时 候 它 是 1; 

e m; 可 选择 的 中 间 按 钮 的 状态 ， 在 中 间 按 钮 进行 按压 的 时 候 它 是 1。 
在 发 送 数据 期 间 ， 首 先 发 送 字 节 数据 包 1， 最 后 发 送 字 节 数据 包 3。 

表 10-1 鼠标 数据 包 格式 














10.2.2 基本 的 初始 化 程序 


鼠标 的 操作 比 键盘 复杂 得 多 。 它 有 不 同 的 操作 模式 。 最 常用 的 就 是 流 模 式 ， 
在 鼠标 探测 到 运动 或 按钮 行为 的 时 候 ， 它 会 发 送 数据 。 如 果 运 动 是 连续 的 ， 数 据 
会 在 指定 的 采样 速率 下 产生 。 

在 操作 期 间 ， 主 机 可 以 发 送 命令 给 鼠标 去 修改 不 同 参数 的 默认 值 并 设置 操作 
模式 ， 鼠 标 也 能 生成 状态 数据 并 发 送 一 个 应 答 。 对 于 我 们 而 言 ， 默 认 值 已 经 足够 
了 ， 只 要 将 鼠标 设置 在 流 模式 下 就 可 以 了 。 

一 个 PS2 鼠标 和 FPGA 主机 之 间 基 本 的 交互 顺序 由 以 下 部 分 组 成 : 

1) 上 电 时 ， 鼠 标 完成 内 部 的 上 电 测 试 ， 鼠 标 发 送 1 字 节 数据 AA， 它 显示 
测试 通过 ， 然 后 发 送 1 字 节 数据 00， 这 是 一 个 标准 PS2 鼠标 的 id 号; 

2) FPGA 主机 发 送 命令 F4， 去 使 能 流 模式 ， 鼠 标 将 用 FE 进行 响应 去 确认 这 
条 命令 接收 到 。 

3) 现在 鼠标 进入 流 模式 并 发 送 标准 的 数据 包 。 

如 果 鼠 标 预先 已 经 插 到 FPGA 板子 上 ， 它 在 板子 上 电 的 时 候 立 即 接 通 并 发 
送 AA 00 数据 以 完成 上 电 测试 。 在 该 时 刻 FPGA 芯片 没有 配置 并 且 不 会 接收 数 
据 。 因 此 ， 我 们 通常 可 以 忽略 上 电 后 第 一 阶段 的 通信 。 最 小 的 鼠标 接口 电路 只 
需要 发 送 F4 命令 ， 检 查 FE 应 答 ， 并 进入 标准 的 操作 模式 去 处 理 鼠 标 规 则 的 
数据 包 。 
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我 们 可 以 通过 复位 命令 去 强制 鼠标 返回 到 初始 状态 : 

1) FPGA 主机 发 送 命令 FF 去 复位 鼠标 ， 鼠 标 将 用 FE 进行 响应 去 确认 这 条 
命令 接收 到 ; 

2) 鼠标 完成 内 部 的 上 电 测 试 并 发 送 AA 00， 在 程序 运行 过 程 中 流 模式 将 会 
ЖЕРЫ 

最 新 的 鼠标 增加 了 更 多 的 功能 性 ， 例 如 一 个 滚轮 和 额外 的 按钮 ， 从 而 发 送 更 
多 的 信息 。 额 外 的 字 节 会 添加 到 最 初 的 3 字 节 数据 中 去 适应 这 些 新 的 特性 。 


10.3 PS2 传输 子 系 统 


10.3.1 主机 到 PS2 设备 的 通信 协议 


主机 到 PS2 设备 的 通信 协议 包括 双向 数据 交换 。 实 际 上 鼠标 数据 和 时 钟 线 是 
OC 门 电路 。 对 于 我 们 的 设计 目的 ， 我 们 把 它们 当 作 是 三 态 。 从 主机 到 PS2 设备 
传输 数据 包 的 基本 时 序 图 在 图 10-1 中 进行 说 明 ， 在 该 图 中 数据 和 时 钟 信号 的 标 
识 是 ps2d 和 ps2c。 为 了 清晰 的 描述 ， 将 该 图 分 成 两 个 部 分 进行 描述 ， 一 部 分 行 
为 由 主机 产生 (FPGA 芯片 ) ， 一 部 分 行为 由 设备 产生 ( 鼠标) 。 基 本 操作 顺序 如 
下 所 示 : 
1) 主机 强制 ps2e 线 至 少 保持 1001us 的 低 电 平 从 而 禁止 任何 鼠标 的 行为 ， 这 
步 可 以 认为 是 主机 请 求 发 送信 息 包 ; 
"i 起 始 位 奇偶 校 验 位 
> 应 管 位 
m 一 FOO C3C3 C) C) CY CA F2) uem 
@ а 
Co шон КИ шы солу ины кк ына өн АЙН Е: ee a 
фо 
图 10-1 PS2 端口 的 主机 到 设备 的 时 序 图 
) 主机 强制 ps2d 线 为 低 电 平 并 禁止 ps2e 线 ( 设 为 高 阻 )， 该 步 认 为 是 主机 
Pe 一 个 起 始 位 ; 
3) 现在 PS2 设备 接收 ps2c 线 而 且 人 负责 产生 PS2 的 时 钟 信 号 ， 当 检测 到 起 始 


位 后 ，PS2 设备 会 产生 1 到 0 的 变化 ; 
4) 一 旦 检测 到 这 个 变化 ， 主 机 在 ps2d 线 上 输出 一 位 有 效 数 据 ， 它 会 保持 这 
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个 有 效 值 直到 在 ps2c 线 上 PS2 设备 产生 1 到 0 的 变化 ， 这 在 本 质 上 是 对 接收 到 
数据 的 确认 ; 

5) 为 了 传递 其 余 7 个 数据 位 和 1 个 奇偶 校 验 位 重复 第 4 步 ; 

6) 发 送 完 奇偶 校 验 位 后 ， 主 机 会 禁止 ps2d 线 ( 设 为 高 阻 )， 现 在 PS2 设备 
接收 ps2d 线 并 通过 将 ps2d RE 0 的 方式 确认 完成 通信 。 按 照 要 求 ， 主 机 可 以 在 
ps2c 线 中 最 后 1 到 0 变化 时 检查 这 些 值 去 确认 数据 包 已 经 成 功 地 发 送 。 


10. 3.2 设计 和 代码 

不 像 接 收 子 系统 ，ps2c 和 ps2d 信号 是 双向 的 通信 。 三 态 缓存 对 于 每 个 信号 
是 必需 的 。 三 态 接口 在 图 10-2 中 已 进行 描述 。tri_c 和 tri_d 信号 是 使 能 信号 ， 该 
信号 可 以 控制 三 态 缓存 。 当 它们 有 效 时 ， 相 应 的 ps2c_out 和 ps2d_out 信号 将 会 
发 送 到 输出 端口 。 

















图 10-2 PS2 传输 子 系统 的 三 态 缓存 


当 设计 发 送 子 系统 时 ， 我 们 可 以 按照 前 面 协议 的 顺序 去 设计 一 个 ASMD 图 ， 
它 在 图 10-3 中 进行 说 明 。FSMD 初始 处 在 空闲 状态 。 开 始 发 送 时 ， 主 机 置 位 wr_ 
ps2 信号 并 在 总 线 上 放置 数据 。FSMD 写 数据 及 奇偶 校 验 位 等 到 移 位 寄存 器 ， 写 
“1-1” | c_reg， 并 跳 到 rst 状态 (“请 求 发 送 ” 状态 ) 。 在 这 个 状态 ， 将 ps2c_out 
置 为 0， 且 相应 的 tric 信号 置 为 有 效 去 使 能 相应 的 三 态 缓存 。c_reg 常用 13bit 计 
数 器 去 产生 164hs 延 时 。 于 是 FSMD 跳 到 start 状态 ， 在 这 个 状态 PS2 时 钟 线 是 禁 
止 的 并 将 数据 线 设 为 1。 现 在 PS2 设备 (鼠标) 在 ps2c 线 上 接收 并 产生 时 钟 信号 。 
在 检测 到 ps2c 信号 的 下 降 沿 后 ， 通 过 下 降 沿 信号 ，FSMD 跳 到 data 状态 并 移动 8 
个 数据 位 和 一 个 奇偶 校 验 位 。n 寄存 器 用 于 跟踪 记录 比特 移动 的 计数 。 然 后 
FSMD 跳 到 stop 状态 ， 在 这 个 状态 数据 线 是 禁止 的 。 当 检测 到 最 后 一 个 下 降 沿 后 
FSMD 返回 到 空闲 状态 。 
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默认  ps2c out-l 
ps2d out-l 
tri_c=0 





data 
ps2d_out=b[0] 
tri d-l 


b + {par.din} 
ce 1...1 


ps2c_out=0 
tri_c=l 
cecl 








图 10-3 PS2 发 送 子 系统 的 ASMD 图 


FSMD 也 包括 tx. idle 信号 标示 是 否 处 在 发 送 的 过 程 中 。 这 个 信号 用 于 协调 发 
送 和 接受 子 系统 之 间 的 操作 。 示 例 10. 1 中 列 出 了 ASMD 图 的 代码 。 滤 波 器 电路 
和 9. 2 节 类 似 用 于 产生 下 降 沿 信和 号 。 
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示例 10.1 PS2 端口 发 送 需 


module ps2_tx 
( 
input wire clk, reset, 
input wire wr ps2, 
input wire [7; 0] din, 
inout wire ps2d, ps2c, 


output reg tx idle, tx done tick 


); 

// 字符 状态 声明 

localparam [2: 0] 
idle =3’b000, 
rts =3’b001, 
start =3 b010, 
data -3'b0ll, 
stop =3'b100; 

// 信号 声明 


reg [2: 0] state reg, state next; 
reg [7: 0] filter reg; 

wire [7: 0] filter next; 

reg f ps2c reg; 

wire f ps2c next; 

reg [3: 0] n reg, n next; 

reg [8: 0] b reg, b next; 

reg [12: 0] c reg, c next; 
wire par, fall edge; 

reg ps2c out, ps2d out; 


always @ ( posedge clk, posedge reset) 
if (reset) 
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begin 
filter_reg <=0; 
f_ps2c_reg <=0; 
end 
else 
begin 
filler reg <=filter_next; 
f ps2c reg <= Ё ps2c next; 
end 
assign filter next = | ps2c, filter reg[7: 1]] ; 
assign f ps2c next = (filter reg ==8’ b11111111) ? 1° bl : 
(filter reg ==8’ b00000000) ? 1” b0 : 


f ps2c reg; 
assign fall edge 2f ps2c reg & ~ Ё ps2c next; 
=== 
// FSMD 
Z7 === T =s 
// FSMD ARAS ABH SY FF tr 
always @ ( posedge clk, posedge reset) 
if (reset) 
begin 
state reg <= idle; 
c reg <=0; 
n reg <=0; 
b reg «20; 
end 
else 
begin 
state reg < = state next; 
c reg «-c next; 
n reg «-n, next; 
b reg <= next; 
end 
// 奇偶 校 验 位 


assign par = ~ (“din); 
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// FSMD ASE 
always @ x 
begin 
state next —state reg; 
c next-c reg; 
n next = п reg; 
b next 2b reg; 
tx done tick 2 1" b0; 
ps2c out =1 bl; 
ps2d out 2 1' bl; 
tri c - 1" b0; 
tri d 2 1' b0; 
tx idle = 1" b0; 
case (state reg) 
idle: 
begin 
ix. idle 2 1' bl; 
if (wr. ps2) 
begin 
b next = | par, din}; 
c. next = 13' hl fff; //2^13 – 1 
state next = rts; 
end 
end 
rts; // Ж ЖАК 
begin 
ps2c out = 1' b0; 
tri e z1' bl; 
c next zc reg = 1; 
if (c reg 2-0) 
state next = start; 
end 
start: // 起 始 位 有 将 
begin 
ps2d out 21" b0; 
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trid=1’bl; 
if (fall edge) 
begin 
n next =4’ h8; 
state next = data; 
end 
end 
data; //8 个 数据 加 一 个 奇偶 校 验 位 
begin 
ps2d out =b_reg[0]; 
tri_d=1’ bl $ 
if (fall edge) 
begin 
b next = |1' bO0, b reg[8: 1]] ; 
if (n reg 220) 
state next — stop; 
else 
n next = п reg — 1; 
end 
end 


stop: // 假设 ps2d Яу 
if (fall edge) 
begin 
state next = idle; 
ix. done tick =1’ bl; 
end 
endcase 
end 
и 三 态 缓存 
assign ps2c = (tri c) ? ps2c_out ; 1' bz; 
assign ps2d = (tri d) ? ps2d out ; 1” bz; 


endmodule 


该 代码 中 没有 错误 检测 电路 。 更 加 健壮 的 设计 应 该 检查 奇偶 校 验 的 正确 性 和 
确认 比特 位 并 包括 看 门 狗 定时 器 以 防止 鼠标 在 不 正确 的 状态 被 锁定 。 
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10.4 双向 的 PS2 接口 


10.4.1 基本 设计 和 代码 


我 们 可 以 结合 接收 和 发 送 子 系统 形成 双向 的 PS2 接口 。 在 图 10-4 中 描述 了 
顶层 模块 图 。 我 们 用 tx idle 和 rx en 信号 去 协调 发 送 和 接收 操作 。 发 送 操 作 具 有 
优先 权 。 当 发 送 子 系统 正在 工作 时 ，tx_iqle 信号 无 效 ， 相 应 的 禁止 接收 子 系统 。 
只 有 当 发 送 子 系统 在 空闲 状态 时 接收 子 系统 才能 处 理 输入 。 示 例 10. 2 中 列 出 了 
相应 的 HDL 代码 。 






















ps2c dout dout 
ps2d 
rx done tick rx done tick 
ps2c 
ps2d 
wr ps2 * 
din din tx done tick tx done tick 


ps2 tx 


clk 一 一 


图 104 双向 PS2 接口 的 顶层 模块 图 
示例 10.2 双向 的 PS2 接口 


module ps2 rxtx 
( 
input wire clk, reset, 
input wire wr ps2, 
inout wire ps2d, ps2c, 
input wire [7: 0] din, 
output wire rx_done_tick, tx_done_tick, 
output wire [7: 0 | ош 


); 
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// 信号 声明 
wire tx_idle; 
// 主体 
//ps2 接收 实例 
ps2 rx ps2_rx_unit 
(. elk(clk) , . reset( reset), . rx en(tx idle) , 
. ps2d( ps2d) , . ps2c( ps2c) , 
. rx done tick(rx done tick) , . dout( dout) ) ; 
//ps2 发 送 实 例 
ps2 tx ps2 tx unit 
(. clk(clk) , .reset(reset) , . wr ps2(wr ps2), 
. din(din), . ps2d(ps2d) , . ps2c(ps2c) , 
. ix idle(tx idle) , .tx done tick(tx done tick) ) ; 
endmodule 
// fi lJ 
wire tx. idle; 
// 主体 
// ps2. HEWES 
ps2_rx ps2_rx_unit 
(. elk( clk), . reset( reset), . rx en(tx idle), 
. ps2d( ps2d) , . ps2c(ps2c) , 
. rx done tick(rx done tick) , . dout( dout) ) ; 
// ps2. 发 送 实 例 
ps2_tx ps2_tx_unit 
(. clk(clk), .reset(reset), . wr. ps2(wr ps2), 
. din(din) , . ps2d(ps2d) , . ps2c(ps2c) , 
. ix idle(tx idle), .tx done tick(tx done tick) ) ; 


endmodule 


10.4.2 确认 电路 


我 们 设计 一 个 测试 电路 去 检验 和 监控 双向 的 接口 操作 。 在 图 10-5 中 描述 了 
模块 图 。 命 令 是 手动 发 送 的 。 我 们 使 用 8bit 开关 设置 数据 (主机 的 命令 ) 并 使 用 
按钮 产生 一 个 时 钟 周期 记号 去 发 送信 息 包 。 接 收 的 信息 包 数 据 开始 通过 字 节 到 
ASCH 转换 电路 ， 这 是 转换 数据 到 两 个 ASCI 字符 加 上 一 个 空格 。 字 符 然后 通过 
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UART 传送 并 显示 在 Windows 终端 上 。 示 例 10.3 中 列 出 了 HDL 代码 。 


tx(to PC) 





rx done tick 
wr ps2 
tx done tick 


ps2 rxtx 







图 10-5 鼠标 监控 电路 模块 图 


示例 10.3 双向 的 PS2 接口 监控 电路 


module ps2_monitor 
( 
input wire clk, reset, 
input wire [7; 0] sw, 
input wire [2 : 0]btn, 
inout wire ps2d, ps2c, 
output wire tx 
dy 
// REIH 
localparam SP 28' h20; // ASCII 中 的 空格 
// 字符 状态 声明 
localparam [1: 0] 
idle =2’b00, 
send] -2' b01, 
send0 =2’ b10, 
sendb =2’ bll; 
// 信号 声明 
reg [1: 0] state reg, state next; 
wire [7: 0] rx data; 
reg [7: 0] w data, ascii code; 
wire psrx done tick, wr ps2; 
reg wr uart; 
wire [3; 0] hex in; 
// EIk 
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//ps2 EKR 22 36 BEI 
ps2 rxtx ps2 rxtx unit 
(. clk(clk) , . reset(reset) , . wr. ps2(wr ps2), 
. din(sw) , . dout(rx data), . ps2d( ps2d) , . ps2e(ps2c) , 
. rx. done tick( psrx done бек), .tx done tick( ) ) ; 
//UART 实例 (只 使 用 UART ар) 
uart uart_unit 
(. clk(clk), .reset(reset) , .rd_uart(1’ b0), 
. Wr_uart(wr_uart), . rx(1' bl), .w_data(w_data), 
іх full() , . rx empty() , . r_data(), . tx(tx)); 
// E BERG BBE BA 
debounce btn db unit 
(. elk(clk) , . reset(reset) , . sw(btn[0]), 
. db level() , . db tick(wr ps2)) ; 


// 状态 寄存 各 
always @ ( posedge clk, posedge reset) 
if ( reset) 
state reg <= idle; 
else 
state reg <= state next; 
// Ае 
always @ * 
begin 
wr. uart = 1 ° b0; 
w. data = SP; 
state next — state reg; 
case (state reg) 
idle; 
if ( psrx_done_tick) // AA PEWS 
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state. next = sendl ; 
send] : // 发 送 高 二 六 进 制 字符 
begin , 
w. data = ascii code ; 
wr uart 21' bl ; 
state next = sendO ; 
end 
send0: // KISMET ANH FFF 
begin 
w. data = ascii code; 
wr. uart =1’ bl; 
state. next = sendb; 
end 
sendb; // 发 送 空 字符 
begin 
w_data = SP; 
wr uart = 1° bl; 
state. next = idle; 
end 
endcase 


end 


// 4  BiAbit 十 六 进 制 代码 
assign hex in = (state reg ==send1)? rx_data[ 7: 4] : 
rx_data[ 3: 0]; 
// FA DEMRE e ASCI 码 
always @ * 
case ( hex in) 

4' h0; ascii code =8’ h30; 

4' hl; ascii code =8’ h31; 

4' h2: ascii. code 2 8' h32; 

4' h3: ascii code 2 8' h33; 

4' h4; ascii code =8’ h34; 
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4'h5; ascii code =8’ h35; 
4' h6: ascii code =8’ h36; 
4'h7; ascii code =8’ h37; 
4'h8. ascii code =8’ h38; 
4' h9; ascii code =8’ h39; 
4'ha; ascii code =8’ h41; 
4'hb; ascii code =8’ h42; 
4'he; ascii code =8’ h43; 
4'hd: ascii code =8’ h44; 
4° һе; ascii code =8’ h45 ; 
default; ascii code =8’ h46; 
endcase 


endmodule 


如 果 鼠 标 连接 到 PS2 电路 ， 我 们 首先 发 送 FF 命令 去 复位 鼠标 ， 然 后 发 送 F4 
命令 去 使 能 流 模 式 。Windows 超级 终端 将 会 显示 鼠标 确认 包 和 后 来 鼠标 运动 信息 
包 。 


10.5 PS2 鼠标 接口 


10.5.1 基本 设计 


基本 的 PS2 鼠标 接口 是 在 双向 PS2 电路 上 创建 另 一 个 电路 层 。 它 的 两 个 基本 
功能 是 启动 流 模式 和 重新 装载 3 数据 字 节 。 电 路 的 输出 由 xm 和 ym 组 成 ， 这 是 
两 个 9bit x Aly 轴 运 动 的 信号 ; btm， 这 是 3bit 按钮 状态 信号 ; DX m. done. tick, 
这 是 一 个 时 钟 周期 状态 信号 ， 当 装载 的 数据 有 效 时 置 位 。 
示例 10.4 中 列 出 了 HDL 代码 。 它 通过 7 个 状态 的 FSMD 来 实现 。 一 旦 复位 
信号 有 效 后 完成 nitl init2 和 ini 状态 。 在 这 些 状态 中 ，FSMD 发 出 FA 命令 ， 
等 待 发 送 完成 ， 然 后 等 待 确认 包 。 鼠 标 现在 流 模式 下 。 然 后 FSMD 得 到 信息 包 并 
在 раскі, pack2, pack3 状态 中 重新 写 人 另外 的 3 个 信息 包 ， 然 后 在 done 状态 下 
激活 m done tick 信号 。FSMD 循环 这 4 个 状态 。 
示例 10.4 基本 鼠标 接口 电路 


module mouse 


( 
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input wire clk , reset , 
inout wire ps2d , ps2c , 
output wire [8:0] xm, ym, 
output wire [2:0 ]btnm, 
output reg m done tick 
у 
// ЖОНУН 
localparam STRM -8' hf4; // MA F4 
// 字符 状态 声明 
localparam [2: 0] 
initl 2 3' b000, 
init2 23' b001, 
init3 23' b010, 
packl =3’ b011, 
pack2 =3’ b100, 
pack3 =3° b101, 
done =3’ b110; 
ЕЕЕ 
reg [2: 0] state reg, state next; 
wire [7; 0] rx data; 
reg wr ps2; 
wire rx done tick, tx done tick; 
reg [8: 0] x reg, y reg, x next, y. next; 
reg [2: O]btn reg, Ып next; 
// 主体 
// 实例 
ps2 rxtx ps2 unit 
(. clk(clk) , . reset(reset) , . wr ps2(wr ps2), 
. din( STRM) , . dout(rx data), . ps2d(ps2d), . ps2c(ps2c) ， 
. rx done tick( rx done, tick) , 
. ix done tick(tx done tick) ) ; 
/人 /主体 
// FSM 状态 和 data 状态 
always @ ( posedge clk, posedge reset) 
if ( reset) 
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begin 
state reg <= initl ; 
x reg <=0; 
y reg «20; 
btn reg <=0; 
end 
else 
begin 
state reg «-state next; 
x reg «-x next; 
тев «-y next; 
btn reg <= btn next; 
end 
// FSMD kie dH 
always @ * 


begin 
state next = state reg; 
wr ps2 =1’b0; 
m done tick 21' b0; 
x next —-x reg; 
y_next = y reg; 
btn next = btn reg; 
case (state reg) 
initl : 
begin 
wr ps2 =1’bl; 
state next = init2 ; 
end 
init2: // 等待 发 送 完 成 
if (tx. done. tick) 
state next = init3 ; 
init3 ; // 等 竺 确认 包 
if ( rx done tick) 
state next = packl ; 


раскі: // 等 待 第 一 个 数据 包 
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if (rx. done. tick) 
begin 
state. next = pack2 ; 
y_next[ 8 ] = rx data[5]; 
x next[8] 2 rx data[4]; 
btn next = rx data[2; 0]; 
end 
pack2; // 等 等 第 二 个 数据 包 
if (rx done tick) 
begin 
state next = pack3 ; 
x next[ 7; 0] =rx_data; 
end 
pack3 : // 等 待 第 三 个 数据 包 
if (rx. done, tick) 
begin 
state next = done; 
y_next[7; 0] 2 rx data; 
end 
done: 
begin 
m done tick 21" bl; 
state next = packl ; 
end 
endcase 
end 
// 输出 
assign xm = x reg; 
assign ym = y reg; 
assign btnm = btn reg; 


endmodule 


该 设计 只 提供 了 最 基本 的 功能 项 。 类 似 于 8.2.4 节 ， 更 加 高 级 的 电路 应 有 更 
健壮 的 方法 去 启动 流 模式 并 增加 一 个 额外 的 缓冲 区 ， 实 现 与 外 部 系统 更 好 的 交 
Hs 
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10.5.2 测试 电路 


我 们 用 简单 的 测试 电路 去 验证 PS2 接口 。 本 电路 使 用 鼠标 去 控制 8 个 板子 上 
的 LED 灯 。 只 有 其 中 的 一 个 LED 灯亮 且 亮 灯 的 位 置 跟着 x 轴 鼠 标 移动 。 按 鼠标 
左 键 和 右键 分 别 点 亮 在 最 左边 的 位 置 或 最 右边 的 位 置 上 的 LED AT. 

示例 10.5 中 列 出 了 HDL 代码 。 它 使 用 了 一 个 10 位 计数 器 跟踪 记录 当前 x 
轴 的 位 置 。 当 新 的 数据 项 有 效 时 该 计数 器 更 新 。 当 按 下 左边 或 右边 鼠标 按钮 时 ， 
计数 器 重 置 为 0 或 最 大 值 。 否 则 ， 其 加 上 这 个 沿 着 x 轴 移 动量 的 有 符号 数值 。 译 
码 电路 用 计数 器 的 3 个 最 高 有 效 位 去 激活 其 中 的 一 个 LED 灯 。 

示例 10.5 鼠标 控制 LED 电路 


module mouse_led 
( 
input wire clk, reset, 
inout wire ps2d, ps2c, 
output reg [7: 0] led 
ri 
// (FFH 
reg [9: 0] p_reg; 
wire [9: 0] p next; 
wire [8: 0] xm; 
wire [2: O]btnm; 
wire m done tick ; 
// 主体 
// 实例 
mouse mouse unit 
(. elk(clk) , . reset( reset) , . ps2d( ps2d) , . ps2c(ps2c) , 
.xm(xm), . ym(), . btnm(btnm) , 
. m. done tick( m, done tick) ) ; 
// 计数 天 
always @ ( posedge clk, posedge reset) 
if (reset) 
p_reg <=0; 
else 


p reg <=p_next; 
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assign p. next = ( ~ m done tick) ? p reg. : // RUKIA 
(btnm[0]) 210'b0 : // ZWA 
(btnm| 1 | ) ? 10' h3ff : // 右边 按 知 
p_reg + {xm[8], xm}; //x filis ah 
always @ * 
case (p reg[9: 7]) 
3' b000; led 28' b10000000 ; 
3' b001 ; led =8 b01000000; 
3' b010: led = 8' b00100000; 
3' b011; led =8’ b00010000; 
3' b100: led =8’ Ь00001000; 
3'b101: led =8’ b00000100; 
3' b110: led =8’ b00000010; 
default; led = 8' b00000001 ; 
endcase 


endmodule 


10.6 文献 备注 
本 章 附 录 资 料 与 第 9 章 类 似 。 
10.7 实验 
鼠标 主要 用 于 图 像 视频 接口 ， 这 在 13 章 和 14 章 进 行 了 描述 。 许 多 附加 的 相 
关 鼠 标 实验 能 够 在 这 些 章节 中 找到 。 
10.7.1 键盘 控制 电路 


主机 也 能 够 发 送 命令 对 PS2 键盘 设置 某 个 参数 。 例 如 ， 我 们 能 够 通过 发 送 
EDOX 命令 控制 键盘 的 3 个 LED 灯 。 这 个 X 用 “0sne” 的 格式 表示 十 六 进 制 数 ， 
其 中 s、n 和 c fe 1bit 值 ， 它 是 分 别 控制 滚动 锁定 、 数 码 锁定 和 大 写 锁 定 的 LED 
灯 。 我 们 可 以 将 这 些 特征 合并 到 9. 4. 1 节 键 盘 接口 电路 中 ， 并 用 3bit 开关 去 控制 
这 3 个 键盘 的 LED 灯 。 设 计 扩展 接口 电路 、 重 新 综合 电路 和 验证 操作 。 
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10.7.2 增强 的 鼠标 接口 


鼠标 接口 在 10.5 节 已 描述 ,我们 可 以 通过 手动 使 能 或 禁止 流 模式 的 方式 改 
变 设计 。 这 可 以 用 ЕРСА 板 的 两 个 按钮 来 实现 。 一 个 按钮 发 送 复 位 命令 FF, € 
可 以 在 操作 过 程 中 禁止 流 模式 ， 而 另 一 个 按钮 发 送 FA 命令 去 使 能 流 模 式 。 我 们 
可 以 修改 原始 接口 去 合并 这 些 特 征 ， 重 新 综合 LED 测试 电路 去 验证 这 些 操作 。 


10.7.3 鼠标 控制 7 段 LED 显示 器 


我 们 可 以 用 鼠标 在 四 位 数 的 七 段 LED 显示 器 中 输入 4 位 十 进 制 数 。 该 电路 
的 功能 如 下 : | 

e 只 有 LED 显示 器 4 个 小 数 点 中 的 一 个 是 亮 的 ， 这 个 亮 灯 的 小 数 点 说 明 选 
择 的 数字 位 置 ; 

e. 选择 的 数字 位 置 跟着 鼠标 的 x 轴 移 动 ; 

e 选择 的 7 段 LED 显示 器 内 容 是 十 进 制 数 (0，…，9) 和 鼠标 y 轴 移 动 的 变 
化 。 

设计 和 综合 这 个 电路 并 验证 其 操作 。 
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11.1 引言 


随机 存 取 存 储 器 (RAM) 在 数字 系统 中 被 作为 大 容量 存储 器 使 用 ， 因 为 一 个 
RAM 的 单元 比 一 个 触发 器 单元 简单 许多 。RAM 的 一 般 使 用 类 型 是 异步 静态 存储 
器 (SRAM) 。 寄 存 器 的 工作 原理 是 在 时 钟 信号 的 一 个 上 升 沿 或 下 降 沿 到 来 时 对 数 
据 进行 采样 和 存储 ， 而 从 异步 SRAM 中 访问 数据 比 之 更 加 复杂 。 读 写 操作 要 求 
数据 、 地 址 和 控制 信号 在 特定 时 序 下 有 效 ， 并 且 上 述 信号 在 进行 读 写 操 作 的 这 一 
段 时 间 内 必须 是 稳定 的 状态 。 

同步 系统 直接 访问 SRAM 难以 实现 。 我 们 通常 采用 存储 控制 器 作为 外 部 接 
口 ， 外 部 接口 同步 地 从 主 系统 接收 命令 ， 然 后 产生 适当 的 同步 信号 去 访问 
SRAM。 控 制 器 通过 详细 的 时 序 要 求 保 护 主 系统 ， 并 使 得 存储 器 访问 就 像 同步 操 
作 。 存 储 控制 器 的 性 能 是 通过 在 给 定 的 周期 内 完成 访问 寄存 器 的 次 数 来 衡量 。 虽 
然 设计 一 个 简易 的 存储 控制 器 是 简单 的 ， 但 是 处 理 好 时 序 问 题 以 达到 最 佳 性 能 要 
求 是 十 分 困难 的 。 

S3 ЖОН 2 1 256K x 16 异步 SRAM 器 件 ， 即 共有 1M 字 节 的 存储 空间 。 在 本 
章 ， 我 们 将 展示 这 些 器 件 的 存储 控制 器 结构 。 因 为 每 个 RAM 器 件 的 时 序 特性 是 
不 同 的， 控制 器 只 适合 于 特定 的 器 件 。 然 而 ， 相 同 的 设计 原理 可 以 应 用 于 类 似 的 
SRAM 器 件 。Xilinx Spartan-3 咒 件 也 包含 少量 的 嵌入 存储 块 。 这 部 分 存储 絮 的 使 
用 在 第 12 章 论述 。 


11.2 IS61LV25616AL SRAM 的 特性 


11.2.1 Block 示意 图 和 LO 信号 


S3 板 有 两 个 IS61LV25616AL 型 器 件 ， 这 些 器 件 是 集成 硅 解 决 方案 公司 (Inte- 
grated Silicon Solution, Inc. ( 1851) ) 制造 的 256K x16SRAM。 简 化 的 Block 示意 图 
如 图 11-1a 所 示 。 这 个 器 件 具 有 18bit 地 址 总 线 ad 、 双 向 的 16bit 数据 总 线 dio 和 
5 组 控制 信号 。 数 据 总 线 分 为 高 字 节 和 低 字 节 ， 高 、 低 字 节 可 单独 访问 。5 组 控 
制 信号 如 下 : 
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1861 LV25616AL SRAM 的 规格 说 明 










256K X 16. 


ad 的 逻辑 单元 


dio( 高 ) 一 








оо + Oo 


dio( 低 ) — 





























ce n 
wen 
oe n 
lb n 
ub n 
a) Block 示 意图 
操作 cen wen oe n lb n ub n dio( 低 ) dio( 高 ) 
无 效 | - - - - “Ж Z 
0 l l - - Z Z 
0 Е - l | Z 7 
ië l 0 0 | 数据 输出 Z 
0 1 0 1 0 Z 数据 输出 
0 1 0 0 0 数据 输出 数据 输出 
写 0 0 - 0 l 数据 写 入 Z 
0 0 - l 0 2 数据 写 入 
0 0 E 0 0 数据 写 入 数据 写 入 
b) 功能 表 
操作 we n oe n dio( l6bits) 
输出 无 效 | 1 Z 
读 16bit 字 1 0 数据 输出 
写 16bit 字 0 - 数据 写 入 
c) 简化 功能 表 


图 11-1 1551 256K x 16 SRAM 的 BLOCK 示意 图 和 功能 
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ce_n( 片 选 使 能 ) : 芯片 有 效 或 无 效 控制 信号 ; 
we_n( 写 使 能 ) : 写 操作 有 效 或 无 效 控制 信号 ; 
oe_n( 输 出 使 能 ) : 输出 有 效 或 无 效 控制 信和 号; 
lb_n( 低 字 节 使 能 ) : 数据 总 线 的 低 字 节 有 效 或 无 效 控制 信号 ; 
ub_n( 高 字 节 使 能 ) : 数据 总 线 的 高 字 节 有 效 或 无 效 控制 信号 。 

所 有 的 这 些 信 号 均 是 低 有 效 ， 并 且 用 n 后缀 强调 这 个 特性 。 具 体 的 功能 表 如 
图 11-1b 所 示 。ce_n 信号 可 以 用 来 调整 存储 器 的 扩展 ，we_n 信号 和 oe n 信号 分 
别 用 来 控制 写 操作 和 读 操 作 。lb_n 信号 和 ub_n 信号 用 于 高 低 字 节 (byte-oriented) 
配置 。 

在 本 章 的 剩余 内 容 中 ， 我 们 将 举例 说 明 存 储 控制 器 的 设计 和 时 序 问题 。 为 了 
更 加 清晰 的 阐明 ， 我 们 使 用 单个 SRAM 器 件 ， 以 16bit 字 的 形式 访问 SRAM。 这 
就 意味 着 ce n, lb n 和 ub_n 信和 号 应 一 直 有 效 ( 即 ， 约 束 为 0) 。 简 化 功能 表 如 图 
11-1e 所 示 。 


11.2.2 时 序 参数 


异步 SRAM 的 时 序 特性 十 分 复杂 ， 包 含 的 参数 超过 24 个 。 我 们 仅 专 注 于 与 
我 们 设计 相关 的 几 个 关键 参数 。 

两 种 类 型 的 读 操作 简化 时 序 图 如 图 11-2a 和 图 11-2b 所 示 。 相 应 的 时 序 参 数 
有 : 

e inc: 读 周 期 时 间 ， 两 次 读 操作 之 间 经 过 的 最 短 时 间 ， 对 于 SRAM 来 说 ， 
该 参数 与 如 ,类似 ; 

e ta: 地 址 访问 时 间 ， 从 地 址 变换 之 后 到 获得 稳定 的 输出 数据 所 需要 的 时 
Їн]; 

© iom: 输出 数据 保持 时 间 ， 从 地 址 变换 到 数据 信和 号 无 效 的 时 间 ， 不 要 将 上 
述 时 间 与 边沿 触发 FF 的 保持 时 间 混 淆 ， 边 沿 触 发 FF 是 输入 接口 d 的 约束 ; 

ө ty: 输出 使 能 访问 时 间 ， 从 oe_n 有 效 之 后 到 获得 有 效 数 据 所 需要 的 时 
lB]; 

© tuo: 输出 使 能 到 high-Z 的 时 间 ， 从 oe n 无 效 之 后 到 数据 总 线 为 高 阻 的 
时 间 ; 

© tzo: 输出 使 能 到 low-Z 的 时 间 ， 从 oe n 有 效 之 后 到 数据 总 线 离 开 高 阻 
的 时 间 。 需 要 注意 的 是 ， 尽 管 此 时 输出 已 经 不 是 在 高 阻 态 ， 数 据 依然 是 无 效 的 。 
IS61LV25616AL 器 件 中 这 些 参数 的 值 如 图 11-2c 所 示 。 

由 we n 控制 的 写 操作 简化 时 序 示 意图 如 图 11-3a 所 示 。 相 应 的 时 序 参数 如 
Ta 


e twc: 写 周期 时 间 ， 两 次 写 操作 之 间 的 最 短 时 间 ; 


第 11 章 外 部 SRAM - 303 - 








we n-l,oe n-0 























参数 最 小 ”最 大 
"Rc 读 周 期 时 间 10 - 
IAA 地 址 访问 时 间 = 10 
IOHA 输出 数据 保持 时 间 2 = 
‘DOE 输出 使 能 访问 时 间 = 4 
{HzOE 输出 使 能 到 high-Z 的 时 间 - 4 
1.208 输出 使 能 到 low-Z 的 时 间 0 = 





c) 时 序 参数 (单位 :ns) 
图 11-2 读 操作 的 时 序 示意 图 和 参数 


ө t: 地 址 建立 时 间 ， 从 wen 有 效 之 后 到 地 址 稳定 的 最 短 时 间 ; 
e tu: 地 址 保持 时 间 ， 从 we n 无 效 之 后 到 地 址 稳定 的 最 短 时 间 ; 
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© (yu: ме п 脉冲 宽度 ，we_n 必须 有 效 的 最 短 时 间 ; 

e (s: 数据 的 建立 时 间 ， 从 数据 稳定 之 后 到 we. n 由 0 变 为 1 的 跳 变 沿 (该 
跳 变 沿 也 称 为 THE LATCHING EDGE) 的 最 短 时 间 ; 

ө t: 数据 保持 时 间 ， 从 we n H 0 变 为 1 之 后 到 数据 无 效 的 最 短 时 间 。 

IS61LV25616AL 上 述 参数 的 值 如 图 11-3b 所 示 。 全 部 的 时 序 信 息 可 参见 
IS61LV25616AL 器 件 的 数据 手册 。 





ad 








we 











din 
15р fup 
a) 写 周 期 的 时 序 
参数 最 小 ”最 大 
‘we 写 周期 时 间 10 一 
tsa 地 址 建立 时 间 0 _ 
tHA 地 址 保持 时 间 0 _ 
lpwgi 脉冲 宽度 8 = 
fsp 数据 的 建立 时 间 6 一 
hap 数据 保持 时 间 0 = 





b) 时 序 参数 (单位 : ns) 
图 11-3 写 操作 的 时 序 示意 图 和 参数 


11.3 基础 存储 控制 器 


11.3.1 Block 示意 图 
存储 控制 器 的 连接 关系 示意 图 及 输入 /输出 信号 如 图 114 所 示 。 图 中 SRAM 
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这 边 的 信和 号 会 在 11. 2. 1 节 论 述 。 在 主 系统 这 边 的 信号 有 : 

e mem; 当 该 信号 为 1 时 ， 开 始 存储 器 的 读 写 操作 ; 
г/м: 详细 说 明 当 前 操作 是 读 操 作 (1) 还 是 写 操作 (0) ; 
addr; 18bit 的 地 址 总 线 ; 
data_f2s; A SRAM 的 16bit 数据 (后 级 _f2s 代表 着 FPGA to SRAM); 
data_s2f_r: 从 SRAM 中 重新 获得 的 16bit 寄存 器 数据 (后 缀 _s2f 代表 着 
SRAM to FPGA) ; 

€ data_s2f_ur; 从 SRAM 中 重新 获得 的 16bit 非 寄存 数据 ; 

e ready: 该 信号 是 状况 信 叶 ， 标 志 着 控制 器 已 准备 好 接收 新 的 命令 。 当 存 
储 器 的 操作 时 间 超 过 一 个 时 钟 周期 时 ， 需 要 有 ready 信和 号 。 











йй 
ш а 











£ we n 
n 2565416 
em oen "SRAM 
r/w 


cen 
lb n 


clk ub n 








图 114 SRAM 存储 控制 器 的 连接 关系 示意 图 


存储 控制 器 主要 是 在 SRAM 中 提供 “同步 约束 ”( synchronous wrap) 。 当 主 系 
统 想 访 问 存储 器 时 ， 它 将 地 址 和 数据 信号 (对 写 操作 ) 放 在 总 线 上 ， 并 激活 命令 
( 即 : mem 和 rw 信号 ) 。 在 时 钟 的 上 升 沿 ， 所 有 的 信号 被 存储 控制 器 采样 ， 从 而 
执行 想 要 的 操作 。 对 于 读 操 作 来 说 ， 数 据 信 号 在 一 到 两 个 时 钟 周期 之 后 变 成 是 可 
访问 的 。 

存储 控制 器 的 block 示意 图 如 图 11-5 所 示 。 它 的 数据 通道 包含 一 个 存储 地 址 
的 地 址 寄存 器 和 两 个 分 别 存储 各 自用 途 的 数据 寄存 器 。 由 于 数据 总 线 (data bus) 
和 dio 是 双向 信号 ， 我 们 使 用 三 态 缓冲 器 对 其 进行 控制 。 本 设计 中 使 用 一 个 状态 
机 (FSM) 产 生 一 个 合适 的 控制 时 序 ， 时 序 关 系 参考 图 11-2 和 图 11-3 中 的 时 序 示 
意图 和 规格 说 明 。 
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图 11-5 存储 控制 器 的 block 示意 图 


11.3.2 时 序 需求 
乍 一 看 ， 时 序 示意 图 似乎 很 复杂 ， 但 是 实际 上 这 个 控制 时 序 是 相当 的 简单 。 


读 周 期 的 基本 操作 顺序 如 下 : 

1) 将 地 址 信号 放 到 ad 总 线 上 并 使 oe_n 信号 有 效 ， 以 上 两 个 信号 在 整个 操 
作 过 程 中 应 保持 稳定 。 

2) 最 少 延迟 i ， 经 过 这 段 时 间 间 隔 后 ，SRAM 中 的 数据 将 变 成 为 可 接收 访 
问 的 ; 


3) 从 dio 中 更 新 数据 ， 并 使 信号 oe_n 无 效 。 

在 设计 中 ， 我 们 通常 使 用 写 使 能 信号 控制 写 操作 周期 ， 如 图 11-3a 所 示 。 基 
本 的 操作 控制 顺序 如 下 : 

1) 将 地 址 信和 号 放 到 ad 总 线 ， 并 将 数据 信号 放 在 dio 总 线 上 ， 激 活 ме п 信 
号 。 上 述 信号 在 整个 操作 中 需 保 持 稳定 ; 

2) 等 待 至 少 town 5 
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3) ме п 信和 号 无 效 ， 在 上 升 沿 上 将 数据 锁 存 在 SRAM; 

4) 将 数据 信号 从 dio 总 线 上 移 除 。 

注意 到 tw (在 写 结束 后 数据 的 保持 时 间 ) 对 于 本 SRAM 来 说 为 0ns， 这 意味 
着 从 理论 上 讲 可 能 将 数据 移 除 ， 同 时 使 we_n 信号 无 效 。 然 而 ， 因 为 传输 延 时 中 
的 变更 ， 这 种 情形 在 真实 的 电路 中 是 无 法 保证 的 。 为 了 完成 正确 的 锁 存 ， 我 们 首 
先 需 要 确保 we. n 信和 号 先 于 数据 无 效 。 


11.3.3 SRAM 的 寄存 器 文件 


我 们 在 4. 2. 3 节 中 论述 了 寄存 器 文件 的 设计 。 它 的 基本 存储 单元 是 D 触发 
器 ， 因 而 它们 是 完全 同步 的 。 尽 管 SRAM 外 围 的 存储 控制 器 为 同步 接口 ， 寄 存 
器 文件 相对 于 SRAM 有 以 下 几 点 不 同 之 处 : 

e 寄存 器 文件 通常 有 一 个 读 端 口 或 者 多 个 读 端 口 ; 

e 寄存 器 文件 的 读 端 口 和 写 端口 可 以 同时 进行 访问 ( 即 ， 读 操作 和 写 操作 可 
同时 进行 ) ; 

e 寄存 器 的 写 只 需要 一 个 时 钟 周期 ; 

e 从 寄存 器 读 端口 输出 的 数据 一 直 是 有 效 的 ， 读 操作 包括 无 时 钟 或 者 是 额 
外 的 控制 信号 。 

总 的 来 说 ， 寄 存 器 文件 是 更 加 快速 、 更 加 灵活 的 。 然 而 ， 由 于 触发 器 的 电路 
尺寸 大 小 ， 寄 存 器 文件 仅 适 合 于 小 存储 量 的 存储 器 。 


11.4 安全 设计 


如 图 11-5 中 的 模块 示意 图 所 示 ， 由 控制 器 来 产生 SRAM 的 读 写 控制 时 序 。 
第 一 个 方案 选用 安全 设计 ， 这 种 设计 需 准 备 充裕 的 时 序 余 量 ， 且 不 能 使 用 严格 的 
时 序 约束 。 控 制 信号 直接 由 FSM 产生 。 控 制 器 用 2 个 时 钟 周期 ( 即 : 40ns) 完成 
存储 器 的 访问 ， 并 且 需 要 3 个 时 钟 周期 ( 即 : 60ns) 完成 相 邻 交 互 操作 。 


11.4.1 ASMD 


控制 器 的 ASMD 图 可 参见 图 11-6。 图 中 的 状态 机 有 5 个 状态 ， 并 以 空闲 状态 
为 初始 状态 。 当 men 信号 有 效 时 ， 开 始 存 储 操作 。rw 信号 可 判定 ( 当前 操作 ) 是 
读 操 作 还 是 写 操作 。 

对 于 读 操 作 ， 状 态 机 跳 转 到 rdl 状态 。 在 这 个 跳 变 的 过 程 中 ， 存 储 器 地 址 一 
addr 将 会 被 采集 并 存储 到 addr_reg 存储 器 中 。oe_n 信号 在 状态 rdl, rd2 中 的 值 
是 有 效 的 。 当 读 周 期 结束 时 ， 状 态 机 跳 回 到 空闲 状态 。 在 跳 变 的 过 程 中 ， 从 
SRAM 中 重新 取出 的 数据 将 会 被 存 人 data, s2f reg 寄存 器 ， 随 后 oe n 信和 号 将 会 无 
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效 。 在 图 11-5 所 示 的 block 示意 图 中 有 两 个 读 端 口 (信和 号) 。data_s2f г 信号 是 寄 





s2f ur 信号 是 直接 连接 到 
SRAM 的 dio 总 线 数据 。 它 的 
数据 应 该 在 rd2 状态 结束 时 
有 效 ， 并 且 数 据 会 在 状态 机 
进入 空闲 状态 之 后 被 移出 
(总 线 )。 在 一 些 应 用 中 ， 主 
系统 采样 和 存 取 存 储 器 的 读 
出 (数据 ) 放 入 自 带 的 寄存 
器 ， 若 在 接近 一 个 时 钟 周期 











ү Жы addr 











内 也 是 允许 用 这 种 非 寄 存 输 | 一 wawww 
出 的 方式 完成 。 RN А 
对 于 写 操作 ， 状 态 机 跳 | 1C ! 
转 到 wel 状态 。 在 这 个 跳 变 | | | e? || 
的 过 程 中 ， 存 储 器 地 址 “ad- | LT 
dr” 和 数据 “data_f2s” 将 会 F 4 F 











oe_n=0 
Tar dio 


分 别 被 采集 并 存储 到 addr reg | | 
和 data_f2s 存储 器 中 。we_n | 
和 tri. n 信号 在 wrl 状态 都 是 
器 ， 将 数据 放 到 SRAM 的 dio 

总 线 上 。 当 状态 机 跳 转 到 wi2 状态 时 ，we_n 信号 无 效 , 但 і п 信号 依然 保持 。 
当 we n 信号 从 0 变 为 1 时， 这 确保 了 数据 被 正确 地 锁 存 到 SRAM 中 。 当 写 周 期 
结束 时 ， 状 态 机 跳 回 到 空闲 状态 tri n 信号 无 效 以 将 数据 从 dio 总 线 上 移 除 。 控 
制 器 的 ASMD 如 图 11-6 所 示 。 


11.4.2 时 序 分 析 


为 了 确保 存储 控制 器 的 操作 正确 ， 我 们 必须 验证 该 设计 适合 各 种 时 序 需 求 。 
重新 用 50MHz 的 时 钟 信号 控制 状态 机 ， 因 而 在 每 个 状态 上 将 保持 20ns。 

在 读 周期 期 间 ， 对 于 其 中 的 两 个 状态 ，oe_n 是 有 效 的 ， 有 效 时 间 共 40ns， 
即 在 10ns 的 i 要 求 上 提供 30ns 的 时 间 裕 量 。 尽 管 这 意味 着 在 rd2 状态 oe_n 可 
以 是 无 效 的 , 但 是 这 强加 了 一 个 更 加 严格 的 时 序 约束 。 这 个 问题 已 在 11.5.3 17 
描述 。 当 状态 机 由 rd2 状态 跳 转 到 空闲 状态 时 ， 数 据 被 存储 进 data_s2f 寄存 器 
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中 。 尽 管 在 跳 变 的 时 候 oe_n 已 经 无 效 ， 但 是 因为 有 FPGA 的 pad 延 时 和 SRAM 
芯片 的 fazor 延 时 ， 数 据 仍 然 会 保持 一 段 较 短 的 时 间 有 效 。 这 可 以 在 时 钟 边沿 对 
数据 进行 采样 。 

在 写 周 期 期 间 ，we_n 在 wrl 状态 无 效 ， 则 20ns 时 间 间 隔 超出 了 8ns 的 tpw 
的 需求 。 在 wr2 RAS, tron 信号 保持 有 效 ， 因 而 可 以 在 we_n 信号 由 0-1 跳 变 沿 
期 间 数据 依然 保持 有 效 。 

在 执行 期 间 ， 读 操作 和 写 操 作 都 需要 两 个 时 钟 周期 来 完成 。 在 读 操作 期 间 ， 
非 寄 存 数据 ( 即 ，data_s2f_ur) 在 第 二 个 时 钟 周期 的 结尾 ( 即 ， 在 第 二 个 时 钟 周期 
上 升 沿 之 前 ) 有 效 ， 寄 存 数据 ( 即 ，data_s2f_r) 在 第 二 个 时 钟 周期 上 升 沿 之 后 有 
效 。 尽 管 存 储 器 操作 可 以 在 2 个 时 钟 周期 内 完成 ， 但 是 主 系统 不 能 以 这 个 速度 访 
问 存储 器 。 读 操作 和 写 操作 在 操作 完成 之 后 都 必须 返回 到 空闲 状态 。 主 系统 必须 
在 等 一 个 时 钟 周期 才能 执行 新 的 存储 器 操作 ， 因 此 ， 整 个 操作 过 程 需要 3 个 时 钟 
周期 。 


11.4.3 HDL 编码 (执行 ) 


通过 跟随 图 11-5 中 的 block 示意 图 和 图 11-6 的 ASMD 示意 图 的 思路 ， 可 以 
得 到 HDL 代码 。 存 储 控制 器 必须 产生 快速 的 、 无 干扰 的 控制 信号 。 一 种 方法 是 
修改 输出 逻辑 单元 将 摩尔 输出 信和 号 寄存 输出 。 为 了 滤 除 小 毛刺 和 减少 时 钟 到 输出 
的 延 时 时 间 ， 这 种 设计 方案 为 每 个 输出 信号 添加 一 个 缓冲 器 ( 即 ，D 触发 器 ) 。 
为 了 弥补 因 引入 缓冲 器 导致 的 一 个 时 钟 周 期 的 延 时 时 间 ， 在 状态 机 的 输出 逻辑 单 
元 中 ， 我 们 使 用 状态 的 下 一 个 值 ( 即 ，state_next 信和 号) 来 代替 状态 的 当前 值 ( 即 ， 
state reg 信号 ) 。 

完整 的 HDL 代码 如 示例 11. 1 所 示 。 为 了 在 将 来 扩充 更 容易 ， 我 们 将 53 版 的 2 
A~ SRAM 芯片 分 为 A 和 B， 并 在 SRAM 输入 /输出 信号 的 端口 声明 中 加 了 一 个 以 _a 为 
后 缀 的 信号 。 需 注意 的 是 ， 我 们 使 用 三 态 缓冲 器 来 控制 双向 数据 信号 dio a; 

示例 11.1 3 个 周期 相 邻 存储 器 操作 的 SRAM 控制 器 


module sram_ctrl 
( 

input wire clk, reset, 
// 主 系统 的 外 部 输入 输出 
Input wire mem, rw, 
input wire [ 17: 0 ]addr, 
input wire [15; 0] data f2s, 
output reg ready, 
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output wire [15: 0] data s2f г, data s2f ur, 
// SRAM 芯片 的 外 部 输入 输出 

output wire [ 17; 0] ad, 

output wire we n, oe n, 

// SRAM 芯片 的 内 部 信号 

inout wire [ 15: 0] dio a, 


output wire ce a n, ub a n, lb_a_n 


LE 

// 状态 符号 定义 

localparam [2: 0] 
idle =3’ b000, 
гії =3’b001, 
rd2 =3’b010, 
wrl =3’b011, 
wr2 =3’b100; 

// fg FAA 


reg [2: 0] state reg, state next; 
reg [15: 0] data #25 reg, data f2s next; 
reg [15: 0] data s2f reg, data s2f next; 
reg [17: O]addr_reg, addr next; 
reg we, buf, oe buf, tri buf; 
reg we reg, oe reg, tri reg; 
// 主体 
// FSMD 状态 和 数据 寄存 豆 
always @ (posedge clk, posedge reset) 
if ( reset) 
begin 
state reg <= idle; 
addr reg <=0; 
data f2s reg <=0; 
data s2f reg <=0; 
tri reg «-1' bl; 
we reg <=1'Ы; 
oe reg <=1’bl; 


end 
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else 
begin 
state reg «-state next; 
addr reg <= addr. next; 
data f2s reg «- data f2s next; 
data s2f reg <= data, s2f next; 
tri reg «- tri buf; 
we reg «- we buf; 
oe reg <= ое buf; 
end 
// FSMD FREE HAJ 
always (2 * 
begin 
addr next = ааг reg; 
data f2s next = data f2s reg; 
data s2f next = data s2f reg; 
ready = 1’ b0; 
case (state reg) 
idle: 
begin 
if ( = mem) 
state next — idle; 
else 
begin 
addr next = addr; 
if ( ~rw)// & 
begin 
state next = wrl ; 
data f2s next = data #25; 
end 
else// i£ 


state next = rdl ; 


M 


end 
ready 2 1' bl; 


end 
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wrl : 
state next = wr2 ; 
wr2: 
state_next = idle; 
rdl ; 
state next = rd2 ; 
rd2 : 
begin 
data. s2f next = dio a; 
state next — idle; 
end 
default: 
state. next = idle; 
endcase 
end 
// EMAZ 70 
always @ * 
begin 
tri_buf=1’bl; ”// FIR GAX 
we buf =1’ bl; 
oe buf =1’ bl; 
case (state next) 
idle; 
oe buf =1’ bl; 
wrl : 
begin 
tri buf 2 1" b0; 
we buf =1’ b0; 


end 
tri buf 2 1" b0; 
oe buf =1’b0; 


oe_buf =1’ b0; 
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endcase 
end 
// 输出 给 主 系统 
assign data s2f г = data_s2f reg; 
assign data s2f ur = dio a; 
// 输出 给 sram 
assign we n = we reg; 
assign oe n —oe reg; 
assign ad = айг reg; 
// sram its ААУ A 输出 
assign ce a n- 1" b0; 
assign ub a n-1' b0; 
assign lb a п = 1° b0; 
assign dio a = ( ~ ігі reg) ? data f2s reg : 16’ bz; 


endmodule 


为 了 最 小 化 е off-chip pad delay( {Е 11. 5.1 章 有 讨论 ) ， 应 适当 地 配置 相应 
FPGA 的 110 个 引 脚 。 这 可 以 通过 在 约束 文件 中 添加 附加 信息 来 完成 。 一 种 典型 
的 写法 是 : 

NET "ad<17>" LOC-"I3" I IOSTANDARD = LVCMOS33 I 
SLEW = FAST; 


11.4.4 基础 测试 电路 


我 们 使 用 两 个 电路 来 验证 SRAM 控制 器 的 操作 。 第 一 个 电路 是 允许 我 们 手 
动 执行 读 操作 或 写 操作 的 基本 测试 电路 。 除 了 SRAM 芯片 的 110 个 信号 外 ， 这 个 
电路 还 有 下 述 信和 号: 

e sw: 这 是 一 个 位 宽 为 8 位 的 信号 ， 用 来 做 数据 或 地 址 的 输入 ; 

e led: 这 是 一 个 位 宽 为 8 位 的 信号 ， 用 来 显示 重新 获得 的 数据 ; 

e btn[0]: 当 它 有 效 的 时 候 ，sw 信和 号 的 值 为 数据 寄存 器 载 人 的 值 ， 对 于 写 
操作 ， 寄 存 器 的 输出 用 来 做 数据 的 输入 ; 

e btn[1]: 当 它 有 效 的 时 候 ， 控 制 器 用 sw 信和 号 的 值 作为 存储 器 的 地 址 ， 并 
执行 写 操作 ; 

e bn[2]: 当 它 有 效 的 时 候 ， 控 制 器 用 sw 信号 的 值 作为 存储 器 的 地 址 ， 并 
执行 读 操作 。 读 出 的 值 输入 给 led 信号。 

在 写 操作 期 间 ， 我 们 首先 指定 数据 值 ， 并 将 它 加 载 到 内 部 寄存 器 ， 然 后 指定 
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地 址 ， 开 始 写 操作 。 在 读 操作 期 间 ， 我 们 指定 地 址 ， 开 始 读 操 作 。 重 新 获得 的 数 
据 在 8 个 离散 LED 上 显示 。 完 整 的 HDL 代码 如 示例 11.2 所 示 。 
示例 11.2 基础 SRAM 测试 电路 


module ram ctrl test 
( 
input wire clk, reset, 
input wire [7: 0] sw, 
input wire [2: O ]btn, 
output wire [7: 0] led, 
output wire [ 17: 0] ad, 
output wire we n, oe n, 
inout wire [ 15: 0] dio a, 
output wire ce a n, ub a n, lba n 
); 
// 信号 声明 
wire [ 17: 0 ]addr; 
wire [15: 0] data 52; 
reg [15: 0] data #25; 
reg mem, rw; 
reg [7: 0] data reg; 
wire [2: 0] db btn; 
// ЕЖ 
// 实例 
sram ctrl ctrl_unit 
(. clk(clk) , . reset( reset) , . mem( mem), . rw( rw), 
. addr( addr) , . data f2s(data #25), ，. ready( ) , 
. data. s2f r(data s2f), . data_s2f_ur(), .ad(ad), 
.we n(we n), .oe n(oe n), . dio a(dio a), 
.ce a n(ce a n), .ub a n(ub a n), .lb a n(lb a n)); 
debounce deb. ип 
(. elk(clk) , . reset( reset) , . sw(btn[0]), 
. db level() , . db tick(db btn[0])); 
debounce deb. unitl 
(. elk(clk) , . reset(reset) , . sw(btn[1]), 
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. db level( ) . db tick(db btn[1])); 
debounce deb. unit2 
(. elk(clk) , . reset(reset) , . sw(btn[2]) , 
. db level( ), . db tick(db btn[2])); 
// BGG ar fede 
always @ ( posedge clk) 
if (db btn[0]) 


data reg <=sw; 


// 地 址 
assignaddr = | 10' bO, sw} ; 
ZZ 
always @ * 
begin 
data #25 =0; 
if (db bn[1]) // & 
begin 
mem =1’ bl; 
rw =1’b0; 
data_f2s = |8' bO, data_reg} ; 
end 
else if (db btn[2]) // Z 
begin 
mem =1’ bl; 
rw=l’bl; 
end 
else 
begin 
mem =1’ b0; 
rw zl bl ; 
end 
end 
// li 


assign led = data s2f[7: 0]; 
endmodule 
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11.4.5 全 面 的 SRAM 测试 电路 


第 二 个 电路 提供 全 面 的 测试 。 与 其 用 它 验 证 SRAM 控制 器 的 操作 ， 不 如 用 
它 检查 SRAM 芯片 的 完整 性 。 这 个 电路 有 三 种 功能 : 

e 以 最 快 的 速度 将 测试 样品 的 数据 写 人 整个 SRAM ; 

e 以 最 快 的 速度 读 出 整个 SRAM 的 数据 ， 用 原始 的 样品 数据 检查 重新 获得 
( 读 出 ) 的 数据 ， 记 录 读 出 错误 数据 的 数目 ; 

e 写 人 错误 数据 。 

三 种 功能 可 以 通过 3 个 反 跳 按钮 启动 。 

ASMD 图 如 图 11-7 所 示 。 它 包含 3 个 分 支 ， 对 应 着 三 种 功能 。 中 间 的 分 支 
将 测试 样本 数据 写 人 SRAM, wr_clkl, wr_clk2 和 wr_clk3 状态 对 应 着 SRAM 控制 
器 的 idle、wrl 和 wr2 状态 。FSMD 使 用 18 位 的 。 寄存 器 作为 计数 需 并 循环 通过 
该 分 支 2 次。 在 写 操 作 的 过 程 中 ，*e 寄存 器 中 的 内 容 被 当做 地 址 ， 翻 转 的 16LSB 
被 当做 数据 。 当 循环 通过 该 分 支 时 ，FSMD 将 数据 写 人 所 有 存储 器 的 特定 区 域 。 
左面 的 分 支 将 数据 从 SRAM 控制 器 中 读 出 。 它 的 3 个 状态 对 应 着 SRAM 控制 器 的 
idle 、rdl 和 rd2 状态 。FSMD 再 次 循环 通过 分 支 2 次。 重新 获得 的 数据 和 原始 
测试 样品 数据 比较 ， 并 用 err 寄存 器 记录 不 匹配 数目 。 右 边 的 分 支 执行 信号 的 写 
操作 。 它 用 8 位 的 开关 (switch ) 形 成 存储 器 的 地 址 ， 向 该 地 址 写 人 错误 的 样本 数 
Bš. inj 计数 器 用 来 记录 注入 错误 的 数目 。 完 整 的 HDL 代码 如 示例 11.3 所 示 。 

示例 11.3 人 全面 的 SRAM 测试 电路 


module sram test 

( 
input wire clk, reset, 
input wire [7: 0] sw, 
input wire [2: 0 ]btn, 
output wire [3: 0] an, 
output wire [7: 0] led, sseg, 
output wire [17; 0] ad, 
output wire we n, oe n, 
inout wire [ 15: 0] dio a, 
output wire ce a n, ub a n, lba n 

js 

// AS IE PSU] 
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图 11-7 全 面 的 SRAM 测试 电路 的 ASMD 图 
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localparam [2: 0] 
test. init = 3' b000, 
rd clk1 =3'Ь001, 
rd cl =3'Ь010, 
rd clk3 =3’b011, 
Wr. err =3 b100, 
wr clk1 =3’ b101, 
wr clk2 =3'b110, 
wr clk3 =3'blll; 
// fg ЭЛЙ 
reg [2: 0] state reg, state next; 
reg [17: O]addr; 
wire [15; 0] data, s2f; 
reg [15: 0] data #25; 
reg mem, rw; 
wire [2; 0] db btn; 
reg [17: 0] c next, c reg; 
reg [7: 0] inj next, inj reg; 
reg [15; 0] err next, err reg; 


// 主体 


// 实例 
sram ctr] ctr] unit 
(. elk(clk) , . reset(reset) , . mem( тет), . rw(rw), 
. addr( addr) , . data f2s(data f2s) , . ready( ) , 
. data, s2f r() , . data s2f ur(data s2f), .ad(ad), 
.we n(we n), .oe n(oe n), .dio a(dio а), 
.ce a n(ce a n), .ub a n(ub a n), .lb a n(lb a n)); 
debounce deb ип 
(. elk(clk) , . reset(reset) , . sw(btn[0]), 
. db level() , . db tick(db btn[0])) ; 
debounce deb unit 
(. elk(clk), .reset(reset) , . sw(btn[1]), 
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. db level( ) , . db tick(db btn[1])); 
debounce deb unit2 
(. elk(clk) , . reset(reset) , . sw(btn[2]), 
. db level( ) . db tick(db btn[2])); 
disp hex mux disp unit 
(. elk(clk) , .reset(1' b0) , . dp in(4' bl111), 
. hex3(err reg[ 15; 12]), . hex2(err reg[ 11; 8]), 
. hexl (err reg[ 7: 4]), . hexO(err reg[3: 0]), 


.an(an), .sseg(sseg) ) ; 


// FSMD 状态 & 数据 寄存 天 
always @ ( posedge clk, posedge reset) 
if ( reset) 
begin 
state reg < = test init; 
c reg <=0; 
inj reg <=0; 
er reg <=0; 
end 
else 
begin 
State reg <= state next; 
c reg «-c next; 
inj reg <= inj next; 
em reg «-err next; 
end 
// FSMD 下 一 状态 逻辑 单元 
always @ * 
begin 
c next —c reg; 
inj next — inj reg; 
err next — err reg; 


addr =0; 
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rw z1' bl; 
mem =1’b0; 
data, f2s 20; 
case (state reg) 
test init; 
if (db btn[0]) 
begin 
state next = rd. clkl; 
c next 20; 
em next 20; 
end 
else if (db btn[1]) 
begin 
state. next = wr. clkl; 
c next =0; 
inj next 20; 
end 
else if (db btn[2]) 
begin 
State next — wr err; 
inj next = inj reg + 1; 
end 
else 
state next — test init; 
wr err; // 写 一 个 error ; 在 下 面 2 “ИВР 
begin 
state next = test. init; 
mem - 1' bl; 
rw 2 1' b0; 
addr = | 10' bO0, sw}; 
data. f2s = 16’ ҺЕ; 
end 
wr_clkl; //sram_etrl 的 待机 状态 
begin 


state. next = wr. clk2 ; 
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mem =1’ bl; 

rw z 1' b0; 

addr -c reg; 

data #25 = ~ с_тер[ 15: 0]; 


end 
wr_clk2 : //sram ctrl 的 wrl RAS 
state, next = wr. clk3; 
wr. clk3: //sram ctrl [ff wr2 状态 
begin 
c, next 2c reg +1; 
if (c next = 20) 
state next = test. init; 
else 
state next = wr clkl; 
end 
rd. clkl: //sram ctrl 的 待机 状态 
begin 
state next = rd clk2; 


mem =1’ bl; 


rw=1’bl; 
addr = c_reg; 
end 


rd_clk2: //sram. ctrl 的 rdl 状态 
state next = rd clk3; 

rd. clk3: //sram_ctrl 的 rd2 状态 
begin | 


// 比较 恋 出 数据 ; 必须 使 用 非 寄存 输出 


if ( —с_гер[15; 0] ! =data_s2f) 
err next = err_reg + 1; 

c_next =c_reg +1; 

if (c, next 220) 
state next = test, init; 

else 
state. next = rd. clkl ; 


end 


: 321. 
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endcase 
end 
// 输出 
assign led = inj_reg; 
endmodule 


注意 到 写 和 读 不 相 匹配 的 数目 与 七 段 LED 显示 相连 ， 并 以 一 个 4 位 的 十 六 
进 制 数目 的 形式 显示 ， 并 且 注 入 错误 的 数目 和 8 个 离散 的 LED 相连 。 

我 们 可 以 按照 如 下 步 又 使 用 该 电路 : 

e 执行 读 功 能 。 当 SRAM 未 写 人 数据 时 ， 它 在 初始 的 “power-on” 状态 。 此 
HF, LE LED 应 显示 很 多 错误 。 

e 执行 写 功能 。 

e 执行 读 功 能 。 如 果 SRAM 控制 器 和 SRAM 设备 工作 适当 ， 错 误 的 数目 应 
该 是 0。 

e 少量 的 注入 错误 数据 (向 不 同 的 存 取 区 域 ) 。 

e 再 次 执行 读 功 能 。 错 误 的 数目 应 和 注 人 错误 的 数目 相同 。 


11.5 更 主流 的 设计 


虽然 之 前 的 内 存 控制 器 功能 正常 ， 但 性 能 并 不 是 最 佳 的 。 当 SRAM 读 周 期 
和 写 周期 都 是 10ns 时 ， 该 控制 器 的 内 存 访 问 占 用 60ns( 即 ，3 个 时 钟 周期 ) Ж 
节 中 ， 我 们 检查 几 个 主流 的 设计 和 它们 可 能 存在 的 时 序 问题 ， 然 后 讨论 FPGA 的 
特点 去 帮助 解决 这 些 问题 。 


11.5.1 时 序 问题 


异步 SRAM 的 时 序 问题 “在 高 性 能 异步 SRAM 存储 器 中 有 两 个 敏感 的 时 序 
问题 。 第 一 个 问题 是 we_n 信号 无 效 。we_n 功能 从 0 到 1 变化 有 点 像 触发 器 
(FF) 的 时 钟 沿 ， 这 是 数据 锁定 和 存储 到 内 部 寄存 器 单元 。 注 意 SRAM 数据 的 保 
持 时 间 (tm ) 为 0。 虽然 它 表 明 在 同一 时 间 ， 这 对 无 效 we_n 和 移 除 数据 是 允许 
的 ， 但 这 种 方法 在 传输 延 时 上 的 变化 是 不 可 靠 的 。 我 们 必须 保证 数据 从 总 线 移 除 
前 we n 是 无 效 的 。 

第 二 个 问题 是 在 数据 总 线 dio 上 可 能 存在 的 冲突 。 数 据 总 线 是 双向 的 总 线 。 
在 写 操作 期 间 控制 器 将 数据 放置 在 总 线 上 ， 在 读 操作 期 间 SRAM 将 数据 放置 在 
总 线 上 。 如 果 控 制 器 和 SRAM 在 同一 时 间 将 数据 放置 在 总 线 上 ， 大 家 知道 的 一 
个 情况 就 是 读 写 冲突 。 为 了 确保 可 靠 的 操作 应 避免 总 线 冲突 。 
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评估 传输 延 时 、 设 计 一 个 好 的 存储 控制 器 要 求 在 多 信和 号 传输 延 时 上 有 一 个 好 
的 理解 。 然 而 ， 这 是 一 个 困难 的 任务 。 首 先 ， 在 综合 期 间 ， 对 RTL 级 描述 进行 
优化 并 映射 到 互相 连接 的 逻辑 单元 和 线 。 最 终 实现 的 结果 可 能 与 初始 描述 的 模块 
结构 图 不 一 致 ， 因 而 从 初始 的 描述 中 评 佑 传输 延 时 是 困难 的 。 

其 次 ， 存 储 器 操作 包括 芯片 外 的 数据 访问 。 当 信号 通过 FPGA 的 1/0 脚 传输 
时 会 引入 另外 的 传输 延 时 。 该 延 时 ， 大 家 知道 有 时 引 脚 延 时 比 内 部 线 延 时 要 大 很 
多 ， 且 其 精确 值 依赖 多 种 因素 ， 包 括 FPGA 器 件 的 类 型 、 输 出 寄存 器 的 位 置 (在 
LE 或 ТОВ 输入 /输出 缓存 ) 、 输 入 /输出 标准 (0O) 、 转 换 率 、 驱 动 强度 、 外 部 负 
载 。 

这 需要 很 熟悉 FPGA 器 件 知识 和 综合 软件 去 完成 一 个 好 的 时 序 分 析 ， 并 评 佑 
多 种 信号 的 传输 延 时 。 


11.5.2 可 选 设计 


第 一 个 可 选 设计 的 目标 是 减少 总 的 操作 时 间 。 不 需要 每 次 操作 结束 后 返回 到 
空闲 状态 ， 存 储 控制 器 可 以 在 当前 存储 器 操作 ( 即 在 rd2 或 w2 状态 ) 结束 时 检查 
mem 信号 并 决定 下 一 步 做 什么 。 如 果 存 在 还 没有 处 理 的 请 求 它 会 立即 开始 新 的 
存储 操作 。 

图 11-8 中 列 出 了 对 于 该 控制 器 修改 后 的 ASMD 图 。 在 rd2 或 w2 状态 ， 检 查 
mem 和 rw 信号 ， 如 果 另 一 个 存储 器 必须 操作 FSMD 有 可 能 立即 跳 到 rdl 或 wrl 
状态 。 

时 序 分 析 在 11.4. 2 节 开始 介绍 的 时 序 分 析 步 骤 仍 然 适用 于 该 设计 。 然 而 ， 
当 不 同类 型 的 随机 存储 器 操作 完成 时 跳 过 空闲 状态 会 引入 敏感 的 新 因素 。 这 个 问 
题 就 是 数据 总 线 上 可 能 存在 的 冲突 。 

让 我 们 考虑 一 下 读 操 作 后 立即 执行 写 操作 。 在 读 操 作 期 间 ， 信 和 号 从 SRAM 
输入 到 FPCA。 为 了 使 该 操作 更 容易 执行 ， 必 须 开 局 SRAM 的 三 态 缓存 ( 即 ， 数 
据 信 号 ) 和 关闭 FPGA 的 三 态 缓存 ( 即 ， 高 阻 ) 。 在 写 操 作 期 间 ， 信 和 号 从 FPGA 输 
和 人 到 SRAM， 三 态 缓存 器 的 执行 方式 与 读 操 作 中 的 执行 方式 正好 相反 。 注 意 开 启 
或 关闭 一 个 三 态 缓存 需要 一 个 小 的 延 时 。 在 SRAM 芯片 中 ， 在 图 112 中 这 两 个 
延 时 定义 为 tHzor ( oe_n 到 高 阻 的 时 间 ) 和 lizog ( oe n 到 低 阻 的 时 间 ) ° 

SRAM 控制 器 开始 时 ， 三 态 缓存 在 空闲 状态 。 该 状态 为 数据 总 线 提供 足够 的 
时 间 去 设置 在 高 阻 状态 。 这 两 个 设计 要 求 两 个 三 态 缓存 在 随机 操作 器 件 同 时 颠倒 
方向 。 例 如 ， 当 从 rd2 状态 跳 到 wel 状态 时 ，FSMD 产生 信号 去 关闭 SRAM 的 三 
态 缓存 和 开启 FPGA 的 三 态 缓存 。 如 果 SRAM 的 三 态 缓存 关闭 太 慢 或 FPGA 的 三 
态 缓存 开启 太 快 ， 在 这 个 转换 过 程 中 有 可 能 发 生 问 题 。 在 很 小 的 时 间 间 隔 内 ， 双 
方 的 缓存 可 能 允许 数据 放置 到 总 线 上 ， 从 而 发 生 冲 突 。 同 样 地 ， 当 写 操作 后 立即 
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默认 值 : oe_n=1; we_n=1; tri_n=1; ready=0 











ladder addr 





图 11-8 SRAM 控制 器 设计 工 的 ASMD 图 


执行 读 操作 时 ， 也 可 能 发 生 冲 突 。 

随 着 读 写 之 间 的 间隔 越 来 越 小 ， 读 写 之 间 的 冲突 对 器 件 没有 造成 严重 的 损 
害 ， 但 是 有 可 能 引入 短暂 的 大 电流 ， 使 设计 不 可 靠 。 我 们 必须 详细 地 看 时 序 分 析 
报告 去 检查 是 否 可 能 发 生 冲 突 及 微调 时 序 去 确定 问题 。 这 是 个 困难 的 任务 ， 在 
11. 5. 1 节 进 行 讨论 。 
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11.5.3 [ЖИЕП 


时 序 分 析 在 11.4.2 节 进 行 了 描述 ， 它 的 最 初 设 计 提 供 了 较 大 的 安全 余 量 。 
在 该 控制 器 中 ， 存 储 器 操作 占用 两 个 时 钟 周期 等 于 40ns。 因 为 SRAM 的 读 周 期 
和 写 周 期 每 个 是 10ns, 我 们 默认 值 : oe_n=l;we_n=1; tri n-l; ; ready= 0 
自然 想 知道 存储 器 操作 周期 
是 否 能 减少 到 20ns。 在 | | 
ASMD 图 中 通过 除去 r2 和 | ， 
wr2 状态 就 可 以 做 到 。 第 二 个 | ， 
可 选 设计 就 是 使 用 这 个 方法 。 | ， 
图 11-9 中 列 出 了 修改 后 的 | | 











ASMD 图 。 它 占用 一 个 时 钟 周 
期 完成 存储 器 访问 并 要 求 两 
个 时 钟 周期 完成 整个 操作 。 

时 序 分 析 ”从 初始 控制 
器 中 减少 一 个 状态 对 两 个 读 
操作 和 写 操作 都 增加 了 更 严 
格 的 时 序 约束 。 让 我 们 首先 
考虑 读 操 作 。 该 操作 期 间 ， 
地 址 信号 首先 通过 FPGA 的 
IO 脚 传 到 SRAM 的 地 址 总 
A, 并 重新 得 到 数据 ， 于 是 15 SRAM TATR ER Ира 
通过 O 脚 到 FPGA 内 部 逻辑 进行 后 面 的 传输 。 所 有 操作 必须 在 20ns 时 钟 周期 
内 完成 。 加 上 10ns 的 SRAM 地 址 访问 时 间 ， 该 周期 必须 调整 为 2 引 脚 延 时 。 
Spartan-3 器 件 的 引 脚 延 时 在 从 4ns 到 超过 10ns 的 范围 。 因 此 ， 我 们 必须 调整 综 
合 去 完成 这 个 余 量 。 

与 读 操作 不 同 ， 写 操作 是 单方 向 的 ， 只 需要 传输 地 址 、 数 据 和 控制 信号 到 
SRAM 芯片 。 如 果 我 们 假设 信和 号 经 过 类 似 的 引 脚 延 时 ， 延 时 的 绝对 值 是 更 小 的 问 
题 。 用 键 奉 换 信号 的 正常 状态 被 激活 或 无 效 。 在 11.5.1 节 中 进行 过 讨论 ， 在 数 
据 被 完全 地 锁 存 到 SRAM 之 前 we n 必须 无 效 。 在 最 初 的 设计 中 ， 通 过 写 操 作 中 
包含 两 个 状态 来 完成 ，w2 ， 这 时 we m 无 效 但 是 数据 仍然 有 效 ( 即 ti_n 仍 有 
效 ) 。 在 修改 的 控制 器 中 ，we_n tri n 信号 在 wrl 状态 结束 时 同时 无 效 。 由 于 
内 部 逻辑 的 变化 和 引 脚 延 时 ， 正 常 的 综合 不 能 够 保证 在 数据 从 外 部 数据 总 线 移 除 
前 we n 无 效 。 此 外 ， 对 于 一 个 可 靠 的 设计 ， 我 们 必须 调整 综合 去 满足 这 个 目 
标 。 


Taddr*— addr 
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11.5.4 可 选 设计 亚 


我 们 可 以 综合 两 个 先前 设计 中 的 特性 得 到 第 三 个 可 选 设计 。 新 的 控制 器 在 读 
操作 和 写 操作 中 省 略 第 二 个 时 钟 周期 ， 并 人 允许 随机 操作 下 不 返回 空闲 状态 。 这 是 
更 主流 的 设计 。 通 过 修改 先前 两 个 ASMD 图 得 到 图 11-10。 修 改 后 的 设计 用 一 个 
时 钟 周期 完成 存储 器 访问 ， 用 另 一 个 时 钟 周期 完成 随机 操作 。 


默认 值 : oe_n=l; we n-l; tri_n=1; ready=0 










































Al 11-10 SRAM fidi] ae eil Ш ASMD 图 


注意 在 ASMD 图 中 无 法 显示 有 效 时 间 不 到 一 个 时 钟 周期 的 信号 we. no TE wrl 
状态 使 用 we_tmp ， 随 后 的 器 件 中 we n 源 于 该 信号 。 

时 序 分 析 ”因为 新 设计 结合 两 个 先前 设计 的 特点 ， 所 有 的 时 钟 问题 在 前 面 两 
部 分 已 经 讨论 ， 同 样 的 在 这 个 设计 中 也 必须 考虑 。we_n 信号 会 产生 另外 的 问题 。 
在 随机 写 操作 期 间 ，ASMD 停留 在 wel 状态 下 。 在 最 初 的 设计 中 ，we_n 信号 是 
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摩尔 状态 机 的 输出 。 在 这 个 例子 中 它 将 会 连续 地 从 有 效 到 0。 自 从 数据 被 锁定 到 
SRAM 中 we_n 信和 号 在 0 -1 之 间 变 化 ， 控 制 器 没有 稳定 的 功能 。 为 了 解决 这 个 问 
题 ，we_n 信和 号 必须 在 小 部 分 的 时 钟 周期 内 有 效 。 

男 一 个 可 能 解决 该 问题 的 方法 是 在 时 钟 周期 的 开始 一 半 时 使 信号 有 效 ,，10ns 
的 宽度 满足 twee 的 需求 。 直 观 地 ， 我 们 试 着 用 选 通 信号 we tmp 以 及 时 钟 信号 clk 
来 完成 这 件 事情 。 
assign we_n=we tmp | -clk; 

然而 ， 由 于 存在 潜在 的 短 时 脉冲 波形 干扰 和 延 时 变化 ， 这 种 做 法 不 是 一 个 可 
靠 的 解决 方法 。 更 好 的 可 选 设计 在 下 一 部 分 进行 讨论 。 


11. 5.5 Xilinx 公司 的 高 级 FPGA 特点 


本 节 存 储 控制 器 案例 阐明 了 基本 FSM 控制 器 和 同步 设计 方法 的 局 限 性 。 基 
本 上 ，FSM 不 能 产生 比 时钟 信 号 周期 好 的 控制 顺序 。 这 些 可 选 设计 的 操作 依赖 
某 些 因素 ， 这 是 RTL 级 HDL 描述 无 法 详细 说 明 的 。 由 于 传输 延 时 的 变化 ， 综 合 
电路 是 不 可 靠 的 ， 它 有 可 能 工作 也 有 可 能 无 法 工作 。 

这 有 一 些 ad hoc 特性 去 获得 更 好 的 控制 。 这 些 特性 通常 依赖 于 器 件 本 身 和 
软件 。 例 如 ， 数 字 时 钟 管理 器 (DCM) 电路 和 Spartan-3 器 件 输入 /输出 模块 (IOB) 
能 够 帮助 解决 一 些 以 前 讨论 的 问题 。 详 细 讨 论 DCM 和 ТОВ 已 经 超过 了 本 书 的 研 
究 范围 。 本 部 分 ， 我 们 大 概 了 解 了 一 些 方法 ， 并 举例 说 明 如 何 去 应 用 这 些 特性 去 
获得 更 可 靠 的 控制 器 。 

1. ОСМ Spartan-3 的 FPGA 器 件 包含 8 个 数字 时 钟 管理 器 (DCM ) 。 顾 名 思 
义 ，DCM 是 使 用 系统 时 钟 信号 的 电路 。 它 能 够 对 引入 的 时 钟 信 号 进行 倍 频 、 分 
频 或 移 相 操作 产生 新 的 时 钟 信号 。 

还 有 一 个 得 到 更 好 的 控制 器 顺序 的 方法 就 是 使 用 快 时 钟 。 执 行 的 存储 控制 器 
是 相当 的 简单 ， 它 本 身 的 电路 能 够 在 快 时 钟 速率 下 操作 。 例 如 ， 我 们 能 够 隔离 存 
储 控制 器 并 用 DCM 产生 200MHz 时 钟 信号 驱动 它 ， 它 的 周期 只 有 5ns。 图 11-6 
中 考虑 了 ASMD 图 的 写 操作 ， 我 们 需要 扩展 wrl 状态 到 两 个 状态 并 在 这 些 状态 中 
使 we n 信号 有 效 。 现 在 要 求 在 4 个 状态 下 完成 写 操作 。 然 而 ， 由 于 快 时 钟 速率 ， 
4 个 时 钟 周期 加 起 来 只 有 20ns， 这 比 最 初 的 60ns 设计 要 更 好 。 

一 个 简单 的 移 相 时 钟 应 用 在 下 一 部 分 进行 讨论 。 

2. IOB  Spartan-3 FPGA 器 件 的 输入 /输出 模块 (I0B) 在 IO 引 脚 和 器 件 的 内 
部 逻辑 之 间 提 供 了 一 个 可 编程 的 接口 。 通 过 配置 类 似 于 驱动 电路 的 存储 寄存 器 和 
三 态 缓存 来 提供 不 同 的 转换 率 、 驱 动 强度 及 来 支持 多 种 VO 标准 。 

11.5.3 节 讨 论 了 如 何 将 芯片 外 引 脚 延 时 减少 到 最 小 ,我们 能 够 强制 存储 控 
制 器 的 输出 寄存 器 在 ТОВ 以 及 用 固定 转换 率 和 强度 的 配置 驱动 器 发 送 FF。 这 可 
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以 在 约束 文件 中 通过 定义 所 需 的 约束 和 配置 做 到 。 


a| [LUI 
clk180 | | | 





| 
а) b) 


图 11-11 JH DDR 产生 半 周 期 信号 


IOB 也 包括 一 个 双 速 率 ( DDR) 寄存 器 ， 它 有 两 个 时 钟 和 两 个 输入 。 概 念 上 ， 
我 们 可 以 认为 它 的 两 个 输入 是 通过 两 个 时 钟 独立 采样 而 采样 值 是 存储 在 相同 的 寄 
存 器 中 。 可 以 组 合 DDR 寄存 器 和 DCM 去 产生 一 个 控制 信号 ， 它 的 宽度 是 一 个 时 
钟 信 号 的 小 部 分 ，11. 5. 4 节 对 we n 信和 号 进行 了 讨论 。 图 11-11a 为 模块 图 。 合 格 
的 输出 寄存 器 可 以 用 DDR 寄存 器 进行 替代 。DDR 的 顶层 部 分 包含 we tmp 信号 
和 初始 时 钟 信号 clk。DDR 底部 的 输出 约束 为 1 和 时 钟 连接 到 反 相 时 钟 信号 
clk180, clk180 是 通过 DCM 产生 的 。 在 clk180 信号 的 上 升 沿 1 是 始终 负载 ， 这 
也 是 clk 信和 号 的 下 降 沿 。 在 第 二 个 时 钟 周期 中 间 we. n 信号 是 无 效 的 。 时 序 图 见 
图 11-11b 所 示 。 该 方法 可 以 产生 一 个 稳定 的 半 周 期 信号 ， 比 11.5.4 节 门 控 时 钟 
设计 更 可 靠 。 


11.6 文献 备注 


数据 手册 通过 ISSI 发 布 ， 它 为 IS61LV25616AL SRAM 器 件 提供 详细 的 资料 。 
Xilinx 应 用 注释 ，XAPP462 在 Spartan-3 FPGA 中 使 用 数字 时 钟 管理 器 (DCM) ， 并 
讨论 DCM 的 使 用 ， 数 据 手册 ，DS099 Spartan-3 FPGA 系列 : 全 部 的 数据 手册 ， 
说 明 IOB 和 DDR 寄存 器 的 结构 和 配置 。 


11.7 实验 


11.7.1 512K x16 配置 的 存储 器 


有 两 个 256K x16 的 SRAM 芯片 ， 并 且 它 们 的 1⁄0 线路 在 手动 的 S3 板 中 说 
明 。 我 们 可 以 把 它们 扩展 为 512K x 16 的 SRAM, 
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1) 结 合 两 个 芯片 得 到 一 个 设计 ; 
eee 11.4 节 的 程序 为 512K x 16 的 SRAM 设计 一 个 存储 控制 器 ,得 到 
HDL 描述 ; 
3) 为 了 新 控制 器 修改 11. 4. 5 节 的 实验 电路 并 得 到 HDL 描述 ; 
4) 综 合 实验 电路 并 验证 控制 器 和 SRAM 芯片 的 操作 。 


11.7.2 1M x8 配置 的 存储 器 


仅仅 配置 两 个 像 1M x8 的 SRAM 芯片 重复 11.7. 1 节 中 的 实验 。 为 了 这 个 目 
的 可 以 使 用 1b_n 和 ub n 信和 号 


11.7.3 8М x1 配置 的 存储 器 


256K x16 的 SRAM 单一 的 bit 可 以 写成 如 下 : 

e 读 16bit 字 ; 

e 在 该 字 中 修改 指定 的 bit; 

e 回 写 16bit 字 。 

仅仅 配置 两 个 8M x 1 的 SRAM 芯片 重复 11.7. 1 节 中 的 实验 。 


11.7.4 扩展 存储 器 实验 电路 


11.4.5 节 的 存储 器 实验 电路 引导 不 断 的 随机 读 操作 和 随机 写 操作 测试 。 我 
们 可 以 扩展 该 电路 使 它 能 够 包含 不 断 地 在 读 写 操作 交替 的 测试 ， 它 能 够 为 整个 存 
储 空间 测试 电路 交替 写 读 操作 的 问题 。 为 了 进行 更 有 效 的 测试 ， 写 操作 地 址 和 读 
操作 地 址 应 该 是 不 同 的 。 例 如 ， 我 们 可 以 进行 读 操 作 重 新 得 到 前 16 位 置 写 入 的 
数据 (如 果 当 前 写 地 址 是 ec， 读 地 址 将 是 c-16) 。 产 生 改 进 的 ASMD 图 ， 得 到 HDL 
描述 ， 综 合 电路 ， 验 证 它 的 操作 。 


11.7.5 存储 控制 器 和 可 选 设计 工 的 测试 电路 


在 11.5.2 节 获 得 可 选 设计 工 的 HDL 代码 并 产生 类 似 于 实验 11.7.4 的 扩展 
测试 电路 。 综 合 测试 电路 并 检查 操作 期 间 是 否 有 任何 错误 发 生 。 


11.7.6 存储 控制 器 和 可 选 设计 五 的 测试 电路 

在 实验 11.7.5 中 为 11. 5. 3 节 讨 论 的 可 选 设计 了 重复 操作 。 
11.7.7 存储 控制 器 和 可 选 设 计 亚 的 测试 电路 

在 实验 11.7. 5 中 为 11. 5. 4 节 讨论 的 可 选 设计 亚 重 复 操 作 。 
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11.7.8 DCM 的 存储 控制 器 


在 DCM 上 学 习 应 用 记录 并 随 着 11. 5. 5 节 讨 论 的 用 高 时 钟 速率 (150MHz 或 
者 甚至 200MHz) 驱动 安全 的 存储 控制 器 ， 这 在 11. 4 节 进 行 了 讨论 。 得 到 ASMD 
图 和 HDL 代码 ,产生 新 的 实验 电路 。 综 合 电路 并 验证 存储 控制 器 和 SRAM 的 操 
作 。 


11.7.9 高 性 能 存储 控制 器 


学 习 ОСМ All LOB 文件 并 应 用 这 些 特 性 去 改造 11. 5. 4 节 讨 论 的 可 选 设计 亚 重 
复 操作 。 产 生 新 的 实验 电路 。 综 合 电路 并 验证 存储 控制 器 和 SRAM 的 操作 。 
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12.1 简介 


数字 系统 常常 需要 存储 器 来 进行 存储 工作 。 为 满足 这 种 需求 ， 大 多 数 FPGA 
设备 包含 了 特定 的 垦 入 式 存储 器 模块 。 尽 管 这 些 模 块 并 不 能 取代 巨大 的 外 部 存储 
器 设备 ， 但 是 它们 对 于 需要 中 、 小 型 存储 器 的 应 用 软件 很 适用 。 

尽管 存储 器 的 基本 结构 类 似 ， 但 是 它们 的 LO 接口 仍然 存在 很 多 微小 的 区 
别 。 综 合 软件 想 要 从 代码 中 获取 所 需要 的 特性 ， 或 者 从 潜在 的 器 件 库 推断 出 匹配 
的 存储 器 模块 ， 通 常 很 困难 。 在 Xilinx ISE 中 ,我 们 可 以 在 设计 中 使 用 HDL Sc 
fil, Core Generator 程序 或 者 HDL 行为 级 模型 ， 在 设计 中 跟 髓 入 式 存 储 器 模型 相 
结合 。 其 中 第 三 种 是 semi-device 独立 的 ， 在 本 书 中 将 使 用 该 种 办 法 。 在 本 节 中 ， 
简要 地 检查 了 Spartan-3 存储 器 模型 、 上 述 的 前 两 种 方法 , .并 且 提 供 了 关于 HDL 
行为 级 模型 的 一 些 关 键 的 细节 描述 。 


12.2 Spartan-3 RE B HR DE figs 


12.2.1 摘要 


在 Spartan-3 RE FUEL URP НК A sf fas: 分 布 式 КАМ 和 块 RAM。 分 布 式 
RAM 由 逻辑 单元 的 查找 表 (LUT ) 构成。 查找 表 (LUT) 可 以 被 配置 成 16 x 1 同步 
RAM， 多 个 LUT 可 以 被 级 联 来 形成 一 个 更 宽 更 深 的 存储 器 模型 。S3 板 的 Spar- 
tan-3 XC3S200 设备 可 以 提供 30Kbit 的 分 布 式 存储 ， 跟 块 RAM 或 外 部 存储 器 相 
比 ， 该 设备 的 存储 量 较 小 。 更 进一步 地 说 ， 由 于 分 布 式 RAM 使 用 了 逻辑 单元 ， 
导致 这 与 普通 逻辑 竞争 资源 。 因 此 ， 只 有 在 要 用 到 小 型 存储 器 的 相关 应 用 时 可 
行 。 

He RAM J& К Л. FPGA 芯片 中 的 存储 器 模型 ， 从 常用 的 逻辑 单元 
中 被 分 离开 。 它 可 以 被 看 作 是 一 种 被 同步 、 可 配置 接口 封装 的 快速 SRAM。 每 一 
个 块 RAM 包含 有 16K(2”) 数 据 位 加 上 可 选择 的 2K 校 验 位 。 它 可 以 被 定义 成 不 
同 的 位 宽 ， 从 16K x1( 即 2* 到 2°) 到 512 x32( Hl 2^ 8| 2°), Spartan-3 XC3S200 ith 
片 有 12 9: RAM, 共有 172K 数据 比特 。 这 些 块 RAM 可 以 被 使 用 在 中 型 应 用 程 
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序 ， 比 如 FTFO、 大 型 查找 表 ， 或 中 型 本 地 存储 器 中 。 作 为 对 比 ，S3 板 的 外 部 
SRAM 世 片 有 8Mbit 的 容量 。 

分 散 式 RAM 和 块 RAM 都 已 经 被 封装 同步 接口 ， 因 此 ， 不 再 需要 附加 存储 
器 控制 电路 。 它 们 的 使 用 非常 灵活 ， 被 配置 完成 单口 和 双 口 存储 器 ， 并 且 支 持 多 
种 类 型 的 缓冲 和 同步 方案 。 本 书 不 对 其 进行 详细 讨论 ， 我 们 只 能 验证 一 些 常 用 的 
构造 ， 包 括 同 步 的 单口 RAM、 同 步 的 双 口 RAM 以 及 在 12.4 节 中 提 到 的 ROM, 


12.2.2 对 照 


S3 板 的 Spartan-3 XC3S200 芯片 和 53 板 为 存储 元 件 提供 了 一 些 选项 。 谨 记 下 
列 相关 选项 的 作用 是 很 有 好 处 的 : 

e XC3S200 的 寄存 器 : KHA 4. SKbit, RABE POCA L/O 缓冲 器 中 ; 

e XC3S200 的 分 散 式 RAM; 30Kbit， 由 逻辑 单元 构成 ; 

e XC3S200 的 块 RAM: 172Kbit， 设 定 为 12 个 16Kbit 模型 ; 

e 外 部 SRAM: 8Mbit， 设 定 为 2 个 256K x16 SRAM 芯片 。 

这 些 能 帮助 我 们 判断 出 哪个 选项 最 适合 常用 的 应 用 软件 。 


12.3 合并 存储 器 模块 的 方法 


尽管 存储 器 模块 有 着 很 相似 的 内 部 构造 ， 在 接口 上 仍然 存在 微妙 的 区 别 ， 比 
如 读 写 端口 的 数量 、 同 步 配置 、 数 据 和 地 址 缓冲 、 使 能 和 复位 信号 以 及 初始 值 。 
尽管 在 HDL 代码 中 描述 期 望 的 行为 级 模型 是 有 可 能 的 ,但 是 综合 软件 可 能 不 会 
识别 出 设计 者 的 意图 。 因 此 ，HDL 代码 不 能 总 是 推断 出 适当 的 存储 器 常常 带 来 
很 多 不 便 。 在 Xilinx ISE 中 ， 设 计时 有 三 种 方法 来 合并 嵌入 式 存 储 器 模型 : 

e HDL 实例 ; 

@ Core Generator 程序 ; 

e HDL 行为 级 模型 。 

前 两 种 方法 对 于 Xlinix 设计 来 说 十 分 详细 精确 ， 第 三 种 方法 是 对 嵌入 式 器 件 
独立 的 动态 描述 。 由 于 行为 描述 清晰 ， 本 书 中 使 用 该 方法 。 本 章节 提供 了 有 关于 
三 种 方法 的 简要 概述 。 


12.3.1 元 件 例 化 产生 的 存储 器 模块 


在 很 多 早期 的 设计 实例 中 ， 使 用 HDL 元 件 例 化 来 包含 初步 模型 或 创建 一 个 
层次 。 除 了 没有 结构 体 的 HDL 描述 ， 这 与 例 化 一 个 Xilinx 存储 器 模块 是 相似 的 。 
我 们 必须 对 照 指 南 来 找 出 确切 的 模型 名 称 和 相关 参数 以 及 1/0 端口 定义 。 这 是 一 
个 单调 乏味 的 步 又 ， 并 且 对 于 有 着 庞大 的 配置 量 和 设置 的 存储 器 来 说 显然 是 易于 
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出 错 的 。 
许多 Xilinx 元 件 实例 的 代码 可 以 通过 选择 “Edit -Language Templates” 49$ 9]. 
以 下 是 一 个 16K x1 的 双 口 RAM 的 部 分 代码 : 
// RAMBI6-SI-SI ; Virtex- II / I — Pro , 
// Spartan-3/3E 16k x 1 Dual-Port RAM 
// Xilinx HDL Language Template version8. li 
RAMB16-S1-S1# ( 
. INIT-A (1'b0) , 
. INIT-B(1'b0) , 
. SRVAL-A (1' b0) , 
. SRVAL-B (1'b0) , 
. WRITE-MODE-A( " WRITE-FIRST" ) , 
. WRITE-MODE-B ("WRITE-FIRST") , 
. SIM-COLLISION-CHECK ( " ALL" ) , 
. INIT-00 (256' h0---0) ， 
. INIT-3F (256" h0---0) 
) RAMBI6-SI-Sl-inst ( 
.DOA (DOA) , // 1А Ibit 数据 输出 
. DOB (DOB) , // Ж ИВ 1bit 数据 输出 
. ADDRA (ADDRA) , // WOA 14bit ЖЕН Л 
. ADDRB ( ADDRB) , // iO B 14bit ЯЛЕ Л 
. CLKA (CLKA) , // 端口 A Hj] fi 
. CLKB (CLKB) , // 端口 B Mfp 
. DIA (DIA) , // ПА 1bit 数据 输入 
. DIB (DIB) , // 端口 B Ibit 数据 输入 
. ENA (ENA) , // 端口 4 RAM 使 能 输入 
.ENB (ENB) , / / jI1 B RAM {ERESMA 
. SSRA (SSRA) , // 端口 A [aE BAW 复位 输入 
.SSRB (SSRB ) , // 端口 4 [i] Rhy AMMA 
. WEA (WEA) , // ж ПА Et $b; A 
. WEB (WEB) // 端口 B ft ES A 
); 
尽管 代码 容易 获得 ， 但 是 为 了 找 出 正确 的 元 件 和 合适 的 配置 参数 ， 认 真 学 习 
指南 是 必须 的 。 
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12.3.2 核 生成 器 产生 的 存储 器 模块 


为 了 简化 实例 化 步骤 ，Xilinx 提供 一 个 有 效 的 程序 来 生成 Xilinx 特定 的 元 
件 ， 被 称 作 核 生成 器 (Coregen) 。 此 功能 可 以 通过 选择 “Project-New Source” 从 ISE 
环境 中 调用 。 在 “New Source” 向导 对 话 框 弹出 后 ， 选 择 IP( Coregen & Architecture 
向 导 ) 调 用 “Coregen ”程序 。 该 程序 通过 一 系列 询问 并 产生 一 些 文件 来 指引 用 户 。 
在 以 . xco 为 扩展 名 的 文本 文件 中 包含 了 构造 存储 器 元 件 的 必要 信息 。 以 . v 为 扩 
展 名 的 文件 包含 了 用 于 仿真 的 “wrapper " 代码。 这 种 文件 不 能 被 用 来 例 化 期 望 的 
元 件 ， 并 且 在 综合 步 又 中 被 忽略 。 

尽管 使 用 Coregen 程序 比 直接 HDL 例 化 更 加 方便 ， 但 是 它 不 属于 HDL 框架 
内 ， 并 且 会 导致 未 完成 的 设计 在 Xilinx ISE 环境 中 遇 到 兼容 问题 。 


12.3.3 通过 了 HDL 生成 的 存储 器 模块 


尽管 建立 一 个 device-independent HDL 描述 是 不 太 可 能 的 ，ISE 的 综合 程序 ， 
即 XST， 提 供 了 行为 级 НОГ, EG HI THEM Xilinx FPGA 中 的 存储 模型 。 这 些 模板 
是 行为 级 描述 完成 的 ， 不 包含 device-specific 元 件 例 化 描述 。 他 们 非常 容易 被 理 
解 ， 并 且 可 以 在 没有 附加 Xilinx 组 成 的 情况 下 模拟 出 来 。 然 而 ， 由 于 描述 没有 明 
确 地 指出 任何 Xilinx 元 件 ， 代 码 有 可 能 不 被 第 三 方 综合 软件 认可 ， 不 能 总 是 推断 
出 需求 的 存储 器 模型 。 所 以 ， 这 些 模板 最 好 被 描述 为 “semi-portable” 和 ”semi-de- 
vice-independent" 动态 描 述 。 常 用 的 存储 器 模板 在 12.4 节 介 绍 。 

另 一 方面 ， 模 板 方法 的 基础 是 XST 软件 能 够 识别 模板 并 据 此 推断 出 正确 的 
内 存 模 块 的 能 力 。 软 件 在 升级 时 改变 或 曲解 某 些 代 码 。 为 了 确定 我 们 所 需求 的 模 
板 是 否 被 正确 推断 ， 检 查 XST 综合 报告 是 很 好 的 途径 。 


12.4 存储 器 相关 的 HDL 模板 


为 了 使 用 行为 级 HDL 描述 来 推断 出 Xilinx 存储 器 模型 ，XST 的 模板 应 该 被 
紧密 追踪 。 为 了 避免 误 读 ， 我 们 应 该 避免 新 建 属于 自己 的 代码 。 这 些 代码 在 下 列 
的 小 节 中 都 是 建立 在 XST V8. 11 指南 的 模板 上 的 。 除 了 使 用 verilog-2001 进行 端 
口 描述 或 增加 地 址 位 宽度 和 数据 位 宽度 参数 ， 它 们 与 初始 的 模板 是 一 样 的 。 在 独 
立 的 HDL 模块 中 限制 存储 器 描述 是 个 好 的 习惯 ， 这 样 能 使 模块 易于 被 识别 并 且 
在 需要 时 易于 被 取代 。 在 本 小 节 中 ， 分 为 6 个 结构 讨论 行为 级 HDL 模板 ， 包 括 
两 个 单口 RAM， 两 个 双 口 RAM, WA ROM, 
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12.4.1 单口 RAM 


Spartan-3 典 人 式 存储 器 设备 已 经 有 了 同步 接口 ， 这 与 11. 3 节 中 描述 的 一 样 。 
它 的 写 操作 一 直 是 同步 的 。 在 时 钟 上 升 沿 、 地 址 、 输 入 数据 、 有 关 控 制 信号 ， 写 
使 能 被 采样 。 如 果 写 信号 有 效 ， 执 行 写 操作 。( 即 输入 数据 在 地 址 信号 指定 的 存 
储 器 地 址 中 存储 ) o 

读 操作 可 以 是 异步 的 ， 也 可 以 是 同步 的 。 在 异步 读 操作 中 ， 地 址 信号 直接 用 
来 存 取 RAM 队列 。 地 址 信号 改变 后 ， 数 据 在 短暂 的 延 时 后 可 用 。 在 同步 读 操作 
中 ， 地 址 信号 在 时 钟 上 升 沿 采 样 ， 并 被 存储 在 寄存 器 中 。 寄 存 器 地 址 用 于 访问 
RAM 队列 。 因 为 寄存 器 的 作用 ， 数 据 的 可 用 性 被 延迟 ， 并 被 时 钟 信号 同步 。 由 
于 内 部 构造 ， 异 步 读 操作 只 可 能 被 分 散 式 RAM 识别 。 

异步 读 功能 的 单口 RAM 示例 12.1 展示 了 异步 读 功 能 的 单口 RAM 的 模板 。 
这 在 XST 指南 的 rams_04 模块 之 上 进行 了 修改 。 

示例 12.1 异步 读 功 能 的 单口 RAM 的 模板 


// 蜡 步 读 功 能 的 单口 RAM 
// 在 XST 8. li v_rams_04 基础 上 有 改良 
module xilinx_one_port_ram_async 
#( 
parameter ADDR_WIDTH =8, 
DATA_WIDTH =1 


input wire clk, 
input wire we, 
input wire [ ADDR_WIDTH -1: 0 ]addr, 
input wire [ DATA, WIDTH - 1: 0] din, 
output wire [DATA WIDTH -1: 0] dout 
28 
// 信忠 声 明 
reg [DATA WIDTH -1: 0] ram [2* * ADDR_WIDTH -1: 0]; 
// 实体 
always @ ( posedge clk) 
if (we)// 写 功能 


ram[ addr] <= din; 
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// BE 
assign dout = ram[ addr | ; 


endmodule 


这 段 代 码 与 4. 2. 3 节 中 讨论 的 寄存 器 十 分 相似 ， 除 了 在 这 里 读 写 操作 使 用 同 
样 的 地 址 。 它 包括 一 个 用 来 存储 的 2 维 空间 的 排列 数据 类 型 ， 并 且 通 过 动态 指数 
来 存 取 列 表 元 素 。 代 码 显 示 写 操作 被 时 钟 信 号 控制 ， 读 操作 只 由 地 址 决定 。 由 于 
异步 读 操作 只 能 被 分 散 式 RAM 识别 ， 这 种 配置 方式 只 推荐 给 需求 小 型 存储 器 的 
应 用 软件 。 

同步 读 功 能 的 单口 RAM 示例 12.2 展示 了 同步 读 功 能 的 单口 RAM 的 模板 。 
这 在 XST 指南 的 rams_07 模块 之 上 有 了 改善 。 

示例 12.2 同步 读 功 能 的 单口 RAM 的 模板 


// (BED HE HO RAM 
// ТЕХТ 8. li v rams 07 基础 上 有 改良 
module xilinx one. port ram. sync 
#( 
parameter ADDR_WIDTH = 12, 
DATA_WIDTH =8 


input wire clk, 
input wire we, 
input wire [ ADDR_WIDTH -1: 0 ]addr, 
input wire [DATA WIDTH -1: 0] din, 
output wire [ DATA. WIDTH -1: 0 | дош 
J3 
// 信号 声明 
reg [DATA_WIDTH -1: 0] ram [2 * * ADDR_WIDTH -1: 0]; 
reg [ADDR_WIDTH -1: 0 ]addr_reg; 
// ЖЖ 
always @ ( posedge clk) 
begin 
if (we) // 写 功 能 


ram[ addr] <= din; 
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addr_reg <= addr; 
end 
// 读 功 能 
assign dout = ram[ addr_reg | ; 
endmodule 


注意 到 地 址 信号 在 时 钟 上 升 沿 被 采样 并 被 存储 在 addr reg 寄存 器 中 ， 存 储 器 
队列 (ram 信和 号) 通过 addr_reg 信和 号 被 存 取 。 只 有 在 addr_reg 端口 被 更 新 以 后 数据 
才 可 获取 ， 这 就 意味 着 其 与 сік 信号 同步 。 

综合 报告 ”在 综合 过 程 中 ， 一 个 正确 的 RAM 模块 应 该 从 代码 模块 中 被 生成 
出 来 。 我 们 可 以 对 照 综 合 报告 来 确认 КАМ 模块 的 生成 。 例 如 , 同步 读 功能 的 4K 
x8 RAM 的 实例 : 

Xilinx_one_port_ram_sync 

#(. ADDR_WIDTH(12) , . DATA_WIDTH(8) ) ram unit 4k by 8 
(. elk(clk) , . we( we), .addr(addr), .din(din) , . dout(dout) ) ; 
RAM 的 生成 应 该 在 综合 报告 的 HDL 综合 部 分 被 指出 。 


二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 





i mode write-first i i 
aspect ratio 4096-word x  8-bit | 
i clock connected to signal < clk > i rise i 
write enable connected to signal < we > high 
| address connected to signal < addr > | | 
| data in connected to signal < din > | | 
data out connected to signal < dout > | | 
I ram_style Auto i | 
Summary 


inferred 1 RAM(s) 
Ik RAM 的 数量 通常 应 该 在 综合 报告 的 最 终 报 告 部 分 报告 : 


Device utilization summary : 


Selected Device : 3s200ft256-5 
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Number of BRAMs: 2 out of 12 1696 


如 我 们 所 期 望 的 ， 实 现 了 一 个 4K x8 单口 块 RAM， 用 两 个 块 RAM 实现 这 个 
电路 。 


12.4.2 XXL RAM 


— ЗАП RAM 包括 一 个 用 来 作为 存储 通道 的 第 二 端口 。 在 理想 状态 下 ， 第 
二 端口 应 该 能 够 独立 执行 读 或 写 操作 ， 并 有 独立 设置 其 地 址 、 数 据 输入 /输出 和 
控制 信号 的 能 力 。 为 了 与 旧版 的 XST 高 敏 度 温 感 迁 感 器 兼容 ， 我 们 考虑 到 一 个 
只 能 进行 读 操 作 的 单 端口 结构 。 在 本 书 中 ， 双 口 结构 的 主要 应 用 就 是 视频 存储 ， 
这 需要 一 个 写 端口 和 一 个 读 端 口 。 所 以 ， 这 种 结构 不 会 对 我 们 的 目标 产生 严格 的 
约束 。 由 于 在 单口 RAM 中 ， 一 个 双 口 RAM 的 写 操作 可 以 是 异步 的 ， 也 可 以 是 
同步 的 。 

异步 读 操 作 的 双 口 RAM 示例 12. 3 展示 了 异步 读 功能 的 双 口 RAM 的 模板 。 
这 在 XST 指南 的 rams_09 模块 之 上 有 了 改善 。 

示例 12.3 异步 读 功 能 的 双 口 КАМ 的 模板 


// 蜡 步 读 功 能 的 双 口 RAM 
// ТЕХТ 8. li v_rams_09 ЖЕЙ КАЙЫ 
module xilinx dual port ram async 
#( 
parameter ADDR_WIDTH =6, 
DATA_WIDTH =8 


input wire clk, 
input wire we, 
input wire [ ADDR. WIDTH -1: O]addr_a, addr b, 
input wire [ DATA WIDTH -1: 0] din a, 
output wire [ DATA WIDTH -1: Oj]dout a, dout b 
E 
// fé >: BJ 
reg [DATA WIDTH -1: 0] ram [2 * * ADDR WIDTH -1: 0]; 
// 实体 
always @ ( posedge clk ) 
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if (we) // 写 功 能 
ram[ addr a] <= іп a; 
// 两 个 读 功 能 
assign dout a =ram[ addr а |; 
assign dout b = ram[ addr b] ; 


endmodule 


写 操作 与 单口 RAM 的 相似 ， 但 是 代码 中 包含 了 第 二 个 输出 端口 dout_b， 该 
端口 从 第 二 个 地 址 addr_b 中 重新 获取 数据 。 由 于 在 异步 读 操 作 的 单口 RAM 中 ， 
双 口 版 本 只 能 被 分 散 式 RAM 识别 出 ， 因 此 它 的 大 小 是 受 限制 的 。 如 果 我 们 忽略 
dout_a 端口 ， 那 么 这 与 示例 4. 6 中 的 单 端口 读 寄 存 器 文件 相似 。 

同步 读 操作 的 双 口 RAM 示例 12. 4 展示 了 同步 读 功能 的 双 口 RAM 的 模板 。 
这 在 XST 指南 的 rams 11 模块 之 上 有 了 改善 。 

示例 12.4 ”同步 读 功 能 的 双 口 RAM 的 模板 


// 同步 恋 功 能 的 双 口 RAM 
// 在 XST 8. li v rams 11 基础 上 有 政 良 
module xilinx dual port ram sync 
#( 
parameter ADDR_WIDTH =6, 
DATA_WIDTH =8 


input wire clk, 
input wire we, 
input wire [ ADDR. WIDTH -1: O]addr_a, addr b, 
input wire [ DATA. WIDTH -1: 0] din a, 
output wire [ DATA WIDTH -1: 0 |аош a, dout b 
Js 
// 信号 声明 
reg [DATA WIDTH -1: 0] ram [2 * * ADDR_WIDTH -1: 0]; 
reg [ ADDR_WIDTH -1: Oladdr_a_reg, addr b reg; 
// 实体 
always @ ( posedge clk) 
begin 
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if (we) // 写 功 能 
ram[addr a] «-din a; 
addr a reg <= addr a; 
addr b reg <= addr b; 

end 

// 两 个 读 功 能 

assign dout a =ram[ addr a reg]; 

assign dout_b = ram[ адаг b тер | ; 
endmodule 


这 段 代 码 与 示例 12.3 的 相似 ， 除 了 两 个 地 址 是 首先 被 存 人 两 个 寄存 器 中 ， 
并 且 寄 存 器 输出 端 被 用 来 存 取 存储 器 。 


12.4.3 ROM 


尽管 ROM( 只 读 存储 器 ) 的 取 名 是 一 种 组 合 电路 ， 并 且 没 有 内 部 状态 。 它 的 
输出 只 取决 于 输入 (例如 地 址 ) ZE Spartan-3 HA PRA RERAN КОМ, 但 
是 可 以 通过 一 个 组 合 电路 或 者 一 个 写 操 作 无 效 的 单口 RAM 模拟 出 。ROM 的 内 容 
在 HDL 代码 中 可 以 被 表示 成 case 声明 ， 并 在 设备 运行 的 时 候 ， 它 的 值 被 加 载 到 
RAM 中 。 由 于 ROM 建立 在 RAM 的 基础 上 ， 读 操作 可 以 是 异步 的 也 可 以 是 同步 
的 。 

1. 异步 读 操作 的 ROM 由 于 ROM 实际 上 是 一 种 组 合 电路 ， 因 此 没有 缓冲 
器 和 时 钟 信号 。 为 了 与 本 节 中 使 用 的 条 款 协 调 统一 ， 我 们 可 以 称 它 为 异步 读 操作 
的 ROM。 该 类 型 的 ROM 可 以 由 一 个 单独 的 case 语句 陈述 ， 模 板 如 示例 12.5 所 
示 。 在 代码 中 简单 地 重 命名 了 示例 3. 14 中 的 hex-to-seven-segment LED 解码 器 输 
人 /输出 端口 。ROM 函数 的 地 址 作为 case 语句 的 选择 表述 和 相应 的 内 容 ， 被 分 配 
到 数据 信号 中 。 

示例 12.5 异步 读 操 作 的 ROM 的 模板 


module rom_template 
( 
input wire [3; 0 ]addr, 
output reg [7: 0] data 
i 
// 实体 
always @ * 


第 12 # Xilinx Spartan-3 特殊 存储 器 . 341 - 





case (addr) 
4’h0O; data =7’ b0000001 ; 
4' hl; data 27' b1001111; 
4' h2; data 2 7' b0010010; 
4' h3; data =7’ b0000110; 
4' há; data 27' b1001100; 
4' h5; data =7’ b0100100; 
4' h6: data =7 b0100000; 
4' h7: data =7 b0001111; 
4" h8: data =7’ b0000000 ; 
4' h9: data 2 7' b0000100; 
4" ha; data =7’ b0001000; 
4' hb; data =7’ b1100000; 
4" he; data =7’ b0110001 ; 
4' hd; data =7’ b1000010; 
4' he; data 2 7' b0110000; 
4' hf; data =7’ b0111000; 
endcase 


endmodule 


由 于 在 电路 中 没有 地 址 和 数据 缓冲 器 ， 该 ROM 不 能 被 块 RAM 识别 。 这 是 
一 种 与 逻辑 单元 结合 的 电路 的 综合 形式 ， 因 此 ， 这 种 类 型 的 ROM 只 能 适用 于 小 
型 表格 。 

2. 同步 读 操 作 的 ROM 对 于 大 型 的 表格 来 说 ， 利 用 一 个 块 RAM 来 实现 
ROM 是 比较 好 的 方法 。 由 于 块 RAM 的 读 操作 被 时 钟 信号 控制 并 与 之 同步 ，ROM 
同样 需要 一 个 时 钟 信号 。 该 同步 读 操作 的 ROM 模板 如 示例 12. 6 所 示 。 这 在 XST 
指南 的 rams 21c 模板 基础 上 有 所 改进 ， 我 们 以 hex-to-seven-segment LED 解码 器 
作为 示例 。 

示例 12.6 同步 读 操作 的 ROM 的 模板 


module xilinx_rom_sync_template 
( 
input wire clk, 
input wire [3: 0 ]addr, 
output reg [7: 0] data 
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р 
// 信号 声明 
reg [3: 0 ]addr_reg; 
// 实体 
always @ ( posedge clk) 
addr_reg <=addr; 
always @ * 
case (адаг reg) 
4" h0; data =7’ b0000001 ; 
4' hl: data 27' b1001111; 
4' h2; data 2 7' b0010010; 
4" h3; data 2 7' b0000110; 
4' h4; data =7 b1001100; 
4' h5; data =7 b0100100; 
4" h6: data =7’ b0100000; 
4’h7: data 27' b0001111; 
4' h8: data 2 7 ' b0000000; 
4’h9; data =7’ b0000100; 
4' ha; data =7’ 0001000; 
4' hb: data =7’ b1100000; 
4' he; data 27' b0110001 ; 
4' hd: data 27' b1000010; 
4’ he; data 2 7' b0110000; 
4" hf; data 2 7' b0111000; 
endcase 


endmodule 


这 段 代 码 与 单口 RAM 同步 读 操作 的 相似 , 但 是 多 出 一 个 case 语句 。 由 于 该 
ROM 的 功能 取决 于 时 钟 信号 ， 因 此 它 的 时 序 与 普通 的 ROM 不 同 。 时 钟 信号 的 人 
为 定义 对 于 生成 ROM 时 用 到 的 块 RAM 是 很 必要 的 ， 在 综合 过 程 中 ， 软 件 自动 
决定 是 否 使 用 正规 逻辑 单元 或 者 块 RAM 来 实现 电路 。 


12.5 文献 备注 


两 个 Xilinx 应 用 程序 备注 ，XAPP464 使 用 FPGA 生成 的 查找 表 作 为 Spartan-3 
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的 分 布 式 RAM , XAPP463 使 用 FPGA 生成 的 Spartan-3 的 RAM， 提 供 了 分 布 式 
RAM 和 块 RAM 的 详细 信息 。XST 用 户 手册 v8.1 的 的 第 二 章节 HDL Coding Tech- 
niques， 包 括 了 24 个 HDL 代码 模板 来 生成 多 种 类 型 的 存储 器 构造 。 

ISE In-Depth Tutorial ， 是 比较 全 面 的 ISE 指南 ， 其 中 一 章节 介绍 了 Core Gen- 
erator 程序 。 尽 管 该 程序 很 简单 ， 为 了 创建 合适 的 实例 ， 我 们 还 是 需要 知道 模块 
的 基础 功能 以 及 相关 参数 。 


12.6 实验 


12.6.1 基于 块 RAM 的 FIFO 


在 4.5.3 节 中 ,我 们 设计 了 一 个 使 用 寄存 器 来 存储 的 FIFO 缓冲 器 。 为 了 增 
加 它 的 功能 ,我们 可 以 用 一 个 块 双 口 RAM 模块 来 代替 寄存 器 。 为 了 新 的 设计 生 
成 出 HDL 代码 。 将 4.5.3 节 中 讨论 的 电路 与 新 FIFO 缓冲 器 综合 ， 并 验证 它 的 功 
能 。 注 意 由 于 同步 读 功 能 而 导致 新 FIFO 与 之 前 的 FIFO 动作 并 不 完全 一 致 的 地 
方 。 


12. 6.2 基于 块 RAM 的 栈 


在 4.7.7 节 讨 论 了 栈 的 功能 ， 为 了 增加 它 的 功能 ， 我 们 可 以 用 一 个 块 双 口 
RAM 模块 来 代替 寄存 器 。 重 复 该 实验 。 


12.6.3 基于 ROM 的 大 量 信号 地 址 


我 们 可 以 用 2n x mROM 执行 任何 nn- 输 入 、m- 输 出 函数 。 在 3. 9. 2 节 中 讨论 
的 大 量 信 号 地 址 , 假设 a Alb 是 4bit 输 入 信号 。 电 路 设计 如 下 : 

1) 以 通用 的 程序 语言 写 一 个 程序 ， 如 C 语言 或 者 Java， 组 成 一 个 case 语句 ， 
能 生成 该 电路 的 28 * 4 真 值 表 ; 

2) 按照 示例 12. 5 中 的 ROM 模板 设计 该 HDL 代码 ; 

3) 综 合 该 电路 并 验证 它 的 功能 ; 

4) 检 查 综合 报告 并 比较 原 执行 程序 和 基于 ROM 的 执行 程序 的 大 小 (根据 逻 
辑 单元 的 数量 ) ; 

5) 将 a、b 扩展 为 8bit 信号 ， 重 复 步骤 1) ~4)。 


12.6.4 基于 КОМ 的 sin(x) 函数 


执行 sin(x) 函数 的 一 种 方式 是 使 用 查找 表 。 假 设 执行 程序 需要 10bit 输入 协 
议 ( 即 在 输入 范围 0 - 2т 内 ， 有 1024 (2) 3) ， 以 及 8gbit 输出 协议 ( 即 在 输入 
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范围 -1~ +1 内 ， 有 256 (2 ) 点 )。 使 输入 信号 与 输出 信号 分 别 为 10bit x 信号 


All 8bit y 信号 。x、 y 之 间 的 关系 为 二 =sin| тд), 


由 于 sin 函数 的 对 称 性 ， 我 们 只 需要 在 第 一 象限 构造 一 个 2* x7 的 表 ( 即 在 0 


~ 万 范围 ) ， 并 且 使 用 简单 的 前 后 加 工 电路 来 获取 其 他 象限 的 值 。 电 路 设计 如 


T: 

1) 以 通用 的 程序 语言 写 一 个 程序 ， 组 成 一 个 саве 语句 ， 能 生成 该 电路 在 第 
一 象限 的 2 x4 查找 表 ; 

2) 按 照 示例 12.6 中 的 ROM 模板 设计 该 查找 表 的 HDL 代码 ; 

3 ) 构 建 一 个 测试 平台 来 产生 3 个 完整 周期 的 sin 曲线 ， 可 以 用 10bit 计数 器 
来 产生 3 x2" 时 钟 循环 的 10bit ROM 地 址 。 在 ModelSim 中 ， 可 以 模拟 出 y 信 号 的 
形式 ， 以 便于 仿真 出 数 模 转换 的 影响 。 


12.6.5 基于 ROM 的 sin(x) 和 cos(x) RA 


在 许多 通信 调制 设计 中 ，sin(x) 函数 与 cos(x) 函数 是 同时 使 用 的 。 假 设 ， 输 
入 /输出 的 形式 与 实验 12. 6. 4 中 一 样 ， 新 电路 有 两 个 输出 信 叶 ，》 y 


m sin[2s ss] 


910 
Ye x 
y = (2 2i 


尽管 可 以 按照 之 前 的 程序 为 cos(x ) 函数 创建 一 个 新 的 ROM ， 但 是 更 好 的 办 
法 是 sin(x) 5 cos(x) 函数 共享 同一 个 ROM。 这 是 基于 观测 得 出 cos (x) 只 是 对 
sin(x) 的 函数 进行 状态 的 变化 ，FPGA 的 块 RAM 可 以 提供 双 口 通道 。 

该 电路 本 质 上 需要 一 个 双 口 ROM, 没有 这 种 形式 的 存储 器 的 HDL 行为 模 
板 。 我 们 需要 用 HDL 代码 来 实验 ， 并 检查 综合 报告 ， 以 确定 只 生成 出 一 个 
RAM。 为 达到 该 目标 ， 使 用 Core Generator 程序 或 直接 将 HDL 元 件 实例 是 很 有 必 
要 的 。 

构造 如 上 特殊 的 ROM， 并 追踪 前 后 加 工 电路 的 HDL 代码 。 使 用 与 实验 
12. 6.4 相似 的 测试 平台 来 验证 电路 功能 。 


$133 VGA fils I: К 


13.1 简介 


VGA( 视 频 图 形 阵列 ) 是 一 种 在 20 世纪 80 年 代 末 由 ІВМ PC 引进 的 视频 显示 
标准 ， 现 在 已 被 各 种 PC 图 形 硬 件 以 及 监视 器 广泛 支持 。 我 们 在 书 中 讨论 的 是 一 
种 8 色 640 x480 分 辩 率 的 CRT( 阴极 射线 电子 管 ) 基础 监视 器 的 设计 。 本 章 将 验 
证 阴极 射线 电子 管 同 步 以 及 基础 图 形 处 理 ， 第 14 章 将 讨论 文本 生成 。 


13.1.1 CRT 的 基本 工作 方式 


AE CRT 监视 器 概念 图 如 图 13-1 所 示 。 阴 极 电子 枪 发 射 一 束 汇聚 的 电子 
流 ， 电 子 流 经 过 真空 管 而 最 终 打 到 磷 光 屏 上 。 发 光 的 同时 电子 打 到 屏幕 的 磷 点 
上 。 外 部 视频 输入 信号 的 电压 强度 决定 了 电子 束 的 密度 以 及 点 的 亮度 ， 单 一 信号 
图 如 图 13-1 所 示 。 单 一 信号 为 电压 值 在 0 ~0.7V 之 间 的 模拟 信号。 


荧光 屏 
垂直 偏转 线圈 电子 束 


水 平 偏转 线圈 


单 色 





水 平 同步 信号 


垂直 ( 场 ) 同 步 信 号 





图 13-1 CRT 监视 顺 运 行 概念 图 


真空 管 外 有 垂直 偏转 线圈 和 水 乎 偏转 线圈 来 产生 磁场 ， 控 制 电子 束 传播 并 决 
定 电子 束 打 到 屏幕 的 位 置 。 当 今 的 监视 器 ， 电 子 束 在 扫描 时 以 系统 地 固定 模式 在 
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屏幕 上 行进 ， 由 左 到 右 并 从 上 到 下 ， 如 图 13-2 所 示 。 
水 平 消 隐 




















图 13-2 CRT 扫描 模式 


监视 器 内 部 振荡 器 和 放大 器 产生 锯齿 波 来 控制 两 个 偏转 线圈 。 例 如 ， 电 子 束 
从 左边 沿 移动 到 右边 沿 时 ， 水 平 偏转 线圈 的 电压 会 逐步 增加 。 电 子 束 移动 至 右边 
沿 后 ， 当 电压 值 变 为 0 时 ， 电 子 束 迅速 返回 左边 沿 。 锯 齿 波 和 扫描 的 关系 如 图 
13-4 所 示 。 两 个 外 同步 信号 分 别 为 水 平 同步 (hsync) 和 垂直 同步 (vsyne) ， 它 们 共 
同 控制 锯齿 波 的 生成 。 这 些 信号 为 数字 信号 。 水 平 同步 信号 和 锯齿 水 平 部 分 的 关 
系 同样 如 图 13-4 所 示 。 注 意 水 平 同 步 信号 的 “1” 和 “0” 周 期 与 锯齿 波 的 上 升 下 降 
坡度 一 致 。 i 

彩色 CRT 的 基本 工作 方式 与 黑白 CRT 工作 方式 相似 ， 不 同 的 是 彩色 CRT 有 
三 束 电子 束 ， 这 些 电 子 东 投射 红 、 绿 、 蓝 磷 光 剂 点 到 屏幕 上 。 这 3 个 点 组 合 起 来 
形成 一 个 像素 。 通 过 调整 三 路 视频 输入 信号 的 电压 等 级 来 得 到 所 需 的 像素 点 颜 
色 。 


13.1.2 53 板 上 的 VGA 端口 


VGA 端口 有 五 路 有 效 信号 ， 包 括 水 平和 垂直 同步 信号 分 别 为 水 平 同 步 和 垂 
直 同 步 ， 以 及 三 路 视频 信号 分 别提 供 红 、 绿 、 蓝 光 。 它 与 一 个 15 路 引 脚 超 小 型 
D 连接 器 物理 相连 。 视 频 信号 为 模拟 信号 ， 视 频 控制 器 使 用 数字 模拟 转换 器 来 转 
换 数 字 输 出 为 所 需 的 模拟 量 。 如 果 视 频 信 号 使 用 N 位 字 表示 那么 它 可 以 转换 为 
2N 个 模拟 量 级 。 三 路 视频 信号 可 以 产生 23N 种 不 同 颜色 。 同 样 可 知 3N 位 决定 
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f 3N bit 的 颜色 。 在 S3 板 内 每 一 路 视频 信号 使 用 1bit 字 ， 只 能 支持 8 种 不 同 颜 
色 。 可 能 的 颜色 组 合 见 表 13-1。 如 果 我 们 使 用 相同 的 Lbit 信号 驱动 视频 信号 ， 即 


“000? 或 "111”， 那 么 监视 器 的 功能 就 像 黑白 单 色 监视 占 。 
表 13-1 3bit VGA 颜色 组 合 











13.1.3 视频 控制 器 


视频 控制 器 生成 同步 信号 以 及 输出 数据 的 像素 序列 。VGA 控制 器 简要 模块 
图 如 图 13-3 所 示 。 图 中 包括 了 一 个 同步 电路 ( vga_syne) 和 一 个 像素 生成 电路 。 














VGA 控制 器 
Fd 13-3 VGA 控制 器 简要 模块 图 


vga. sync 电路 生成 时 序 以 及 同步 信号 。 水 平 同步 和 垂直 同步 信号 连接 到 
VGA 端口 ， 用 来 控制 监视 器 的 水 平 、 垂 直 扫 描 。 两 路 信号 在 内 部 计算 器 中 解码 ， 
该 计算 器 输出 为 pixel. x 和 pixel. y 信号 。pixel_x 和 pixel. y 信号 标明 了 扫描 相关 
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位 置 以 及 像素 点 详细 的 当前 位 置 。vga_syne 电路 同时 产生 video on 信号 以 指出 是 
否 使 能 显示 。 这 个 电路 的 设计 在 13.2 节 讨 论 。 

像素 生成 电路 生成 三 路 视频 信号 ， 这 些 信号 都 与 三 原色 信号 相关 。 依 据 当 前 
像素 的 坐标 (pixel_x 信号 ，pixel_y 信号 )、 外 部 控制 及 数据 信号 可 以 获得 一 个 颜 
色 的 值 。 这 个 电路 的 更 多 相关 信息 在 本 章 的 第 二 部 分 以 及 第 14 章 中 介绍 。 


13.2 VGA 同步 


视频 同步 电路 生成 水 平 同 步 信 号 和 垂直 同步 信号 ， 水 平 同步 信号 详细 指出 了 
扫 过 一 行 所 需 的 时 间 ， 垂 直 同 步 信 号 详细 指出 了 扫 过 整个 屏幕 需要 的 时 间 。 随 后 
的 讨论 都 是 基于 25MHz 刷新 率 的 640 x 480 分 辨 率 的 VGA 屏 ，25MHz 刷新 率 的 
意思 是 一 秒 内 处 理 25M 个 像素 点 。 注 意 该 分 辨 率 同 样 是 VGA 模式。 

一 个 阴极 射线 管 监视 器 屏幕 包括 一 个 小 黑 边 ， 如 图 13-4 的 顶部 所 示 。 中 间 
的 矩形 是 可 见 部 分 。 注 意 垂直 轴 坐 标 是 向 下 增加 的 。 左 上 角 以 及 右 下 角 的 坐标 分 
别 为 (0，0) 和 (639，479 ) 。 


13.2.1 水 平 同步 


一 次 水 平 扫描 的 时 序 图 在 图 13-4 中 展示 。 一 个 水 平 同步 信号 周期 包含 800 
个 像素 点 并 且 可 以 分 人 4 个 区 域 : 

e 显示 区 域 : 像素 点 实际 显示 在 屏 上 的 区 域 ， 这 个 区 域 的 长 度 为 640 HR 
素 点 ; 

e 折 回 区 域 : 电子 束 在 此 区 域 返回 到 左边 ， 视 频 信号 在 区 域 中 应 为 无 效 即 
黑色 区 域 ， 这 个 区 域 的 长 度 为 96 个 像素 点 ; 

e 右边 界 区 域 : 形成 显示 区 域 右边 界 的 区 域 ， 也 可 以 认为 是 前 边界 即 折 回 
前 的 边界 ， 视 频 信 号 在 区 域 中 应 为 无 效 ， 这 个 区 域 的 长 度 为 16 个 像素 点 ; 

e 左边 界 区 域 : 形成 显示 区 域 左 边界 的 区 域 ， 亦 可 以 认为 是 后 边界 即 折 回 
后 的 边界 ， 视 频 信号 在 区 域 中 应 为 无 效 ， 这 个 区 域 的 长 度 为 48 个 像素 点 。 

注意 右边 界 和 左边 界 的 长 度 可 能 在 不 同 品牌 的 监视 器 中 有 变化 。 水 平 同 步 信 
号 能 够 用 一 个 专用 的 模 800 计算 器 以 及 一 个 解码 电路 得 到 。 这 些 计数 可 以 在 行 同 
步 信号 的 顶端 标记 ， 如 图 134 所 示 。 我 们 特意 从 显示 区 域 的 起 始 处 开始 计数 。 
这 样 允 许 我 们 可 以 将 计数 的 输出 值 作为 水 平 (* 轴 ) 的 坐标 。 这 个 输出 组 成 了 pix- 
el x 信号 。 当 计数 器 的 输出 在 656 和 751 之 间 时 水 平 同步 信号 变 低 。 

注意 在 折 回 的 过 程 中 阴极 射线 管 监视 器 在 左右 边界 内 应 该 为 黑色 。 我 们 使 用 
h_vedio_on 信和 号 来 指出 当前 的 水 平 坐标 是 否 在 可 显示 区 域 。 该 信号 仅 在 像素 计数 
小 于 640 时 为 有 效 。 
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图 134 水 平 扫描 时 序 图 


13.2.2 垂直 同步 


在 垂直 扫描 过 程 中 ， 电 子 束 逐 渐 地 从 顶部 运动 到 底部 再 返回 顶部 。 这 与 刷新 
整个 屏幕 所 需 的 时 间 相符 。 垂 直 同 步 信号 的 形式 与 水 平 同 步 信号 的 形式 相似 ， 如 
图 13-5 所 示 。 运 动 的 时 间 单 位 根据 水 平 扫描 行 描述 。 一 个 垂直 同步 信号 的 周期 
为 525 列 并 且 能 够 分 为 4 个 区 域 ; 

e 显示 区 域 : 水 平行 实际 显示 在 屏 上 的 区 域 ， 这 个 区 域 的 长 度 为 480 行 ; 

e 折 回 区 域 : 电子 束 返 回 到 屏 顶 端的 区 域 ， 视 频 信号 应 为 无 效 ， 这 个 区 域 
的 长 度 为 2 行 ; 

e 底部 边界 区 域 : 形成 显示 区 域 底部 边界 的 区 域 ， 也 可 以 认为 是 前 边界 即 
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一 次 垂直 扫描 (525) | 





图 13-5 ”垂直 扫描 时 序 图 


折 回 前 的 边界 ， 视 频 信 和 号 应 为 无 效 ， 这 个 区 域 的 长 度 为 10 17; 


e 顶部 边界 区 域 : 形成 显示 区 域 顶 部 边界 的 区 域 ， 也 可 以 认为 是 后 边界 即 


折 回 后 的 边界 ， 视 频 信 号 应 为 无 效 ， 这 个 区 域 的 长 度 为 33 行 。 
与 水 平 扫描 相同 ， 顶 端 与 底 端 边界 的 长 度 由 于 不 同 品牌 的 监视 器 可 能 不 同 。 
水 平 同步 信号 能 够 通过 一 个 专用 模 525 计算 器 以 及 一 个 解码 电路 得 到 。 同 样 ， 我 
们 特意 从 显示 区 域 的 起 始 处 开始 计数 。 这 样 允 许 我 们 可 以 将 计数 的 输出 值 作为 垂 
B (y fH) 的 坐标 。 这 个 输出 组 成 了 pixel y 信号 。 当 计数 器 的 输出 在 490 ~491 之 
间 时 垂直 同步 信号 变 低 。 

与 水 平 扫描 相同 ， 我 们 使 用 v video on 信号 来 指出 当前 垂直 坐标 是 否 在 可 显 
示 区 域 。 该 信号 仅 在 行 计数 小 于 480 时 有 效 。 


13.2.3 VGA 同步 信号 的 时 序 计 算 


-如 前 文 所 述 ， 我 们 假设 像素 刷新 率 为 35MHz。 刷 新 率 由 3 个 参数 决定 : 
p: 水 平 扫描 线 的 像素 数 。 例 如 640 * 480 分 辩 率 为 


= 800 pixels 
un line 


l: 一 个 屏 中 的 行 数 即 垂直 扫描 的 行 数 。 例 如 640 x 480 分 辩 率 为 


lines 
12525 ——- 
screen 


s; 每 秒 的 屏 数 。 例 如 自由 闪烁 模式 ， 可 以 表示 为 
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screens 
g.=60————— 


second 
参数 * 详细 描述 了 屏 刷新 的 速度 。 针 对 于 人 眼 ， 刷 新 率 必 须 最 少 为 30 屏 /s 
才能 让 人 认为 运动 是 连续 的 。 为 了 减少 闪烁 ， 监 视 器 通常 都 有 一 个 很 高 的 分 辩 
率 ， 例 如 如 上 所 述 的 60 屏 /s。 像 素 率 可 以 由 以 上 3 个 参数 算出 : 
pixels 


pixel rate =p Xx l xs=25M 一 一 一 
second 


其 他 分 辩 率 与 刷新 率 的 像素 率 可 以 由 相似 的 方式 计算 出 。 显 然 ， 分 辩 率 与 刷 
新 率 提 升 的 同时 像素 率 也 提升 了 。 


13.2.4 HDL 实现 


vga sync 电路 的 功能 已 在 13. 1. 3 节 中 讨论 。 如 果 系 统 时 钟 频率 为 25MHz， 
电路 能 够 被 两 个 专用 计数 器 实现 : 一 个 用 来 保持 对 水 平 扫描 追踪 的 模 800 计数 
器 ， 和 一 个 用 来 保持 对 垂直 扫描 追踪 的 模 525 计数 器 。 

由 于 我 们 的 设计 通常 使 用 原型 板 上 的 50MHz 晶振 ， 系 统 时 钟 频 率 是 像素 率 
的 两 倍 。 我 们 可 以 生成 一 个 25MHz 的 使 能 信号 以 启动 或 暂停 计数 来 代替 违反 同 
步 设计 方法 学 的 构造 一 个 独立 25MHz 时 钟 域 。 这 个 tick 信号 同样 被 发 送 到 p. tick 
端口 ，p_tick 端口 作为 一 个 输出 信号 来 调整 像素 产生 电路 的 操作 。 

HDL 代码 如 示例 13. 1 所 示 。 它 包含 一 个 用 于 产生 25MHz 的 使 能 单位 的 模 2 
计数 器 和 两 个 分 别 用 于 水 平 垂直 扫描 的 计数 器 。 我 们 使 用 两 个 状态 信号 ， 分 别 是 
h_end 和 v_end， 来 指示 水 平和 垂直 扫描 的 完成 。 垂 直 和 水 平 扫描 区 域 的 大 小 各 
异 ， 首 先 将 区 域 大 小 的 值 定义 为 常量 。 这 些 常 量 可 以 很 容易 地 在 当 使 用 了 不 同 分 
辨 率 与 刷新 率 时 改变 。 为 了 消除 潜在 的 故障 , 水 平 同步 和 垂直 同步 信号 插入 了 输 
出 缓存 。 这 样 就 造成 了 一 个 时 钟 周期 的 延 时 。 我 们 应 该 在 像素 产生 电路 中 为 rgb 
信号 加 入 一 个 类 似 的 缓存 来 补偿 这 个 延 时 。 

示例 13.1 VGA 同步 电路 


module vga_sync 
( 
input wire clk, reset, 
output wire hsync, vsync, video on, p tick, 
output wire [9: 0] pixel x, pixel y 
); 
// 常量 声明 
// VGA 640 x480 同步 参数 
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localparam HD = 640; // 2K-¥ š; PC 
localparam HF =48; // KFR (Æ) IA 
localparam HB = 16; // 水 平 后 ( 右 ) 边 界 
localparam HR =96; // КЭТ [s] 
localparam VD 2480; // ÆA iz XBR 
localparam VF 210; // 3E AA ( 上) 边界 
localparam VB 233; // 和 五 直 后 ( 下) 边界 
localparam VR 22; // З Pr #r [ul 
// 82 ias 
reg mod2 reg; 
wire mod2 next; 
// AEG 
reg [9: 0] h count reg, h count next; 
reg [9; 0] v count reg, v count next; 
// di BAF 
reg v sync reg, h sync reg; 
wire v sync next, h sync next; 
// 状态 信号 
wire h_end, v_end, pixel_tick; 
// 主要 结构 
// АЧЕЙ 
always @ ( posedge clk, posedge reset) 
if ( reset) 
begin 
mod2 reg <=1’b0; 
v count reg <=0; 
h conut reg <=0; 
v sync reg <=1’b0; 
h sync reg <=1’b0; 
end 
else 
begin 
mod2 reg «- mod2 reg; 
v count reg «-v count next; 


h count reg «-h count next; 
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v sync reg «-v sync next; 


h sync reg «-h sync next; 


end 
// 使 用 模 2 电路 和 车 成 25MHz 使 能 标记 
assign mod2 next = ~ mod2 reg; 


assign pixel tick = mod2 reg; 
// 状态 信号 
// 欢 平 计数 结束 (799 ) 


assign h end = (h count reg = (HD + НЕ + НВ + HR -1)); 


// 垂直 计数 绪 束 (524 ) 


assign v end = (v. count reg == (VD + VF + VB+VR-1)); 


// 下 一 状态 水 平 同步 模 800 HAARE t 


always @ +* 
if (pixel_tick) //25MHz fk nj 
if (h_end) 


h count next = 0; 
else 
h count next 2h count reg +1; 
else 
h. count next = h. count. reg; 


// 下 一 状态 垂直 局 步 模 525 ЫЕ 


always @ * 
if (pixel tick & h end) 
if (v. end) 


v. count. next 20; 
else 
v count next —v count reg + 1 š 
else 
v_count_next = v_count_reg; 

// zk Rust E AE DF DUE Ges Hi ü Fl 
// h. sync, next 信号 声明 在 656 ~ 751 之 问 
assign h. sync, next = (h count reg > = (HD + HB) && 


h count reg <= (HD + HB + HR -1)); 


// v. sync. next 信号 声明 在 490 ~491 22 [8] 
assign v. sync. next = (h count reg > = (Ур + VB) && 
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h count reg <=(VD+VB+VR-1)); 
// BA BR 
assign video on = (h count reg < HD) &&(v count reg < VD); 
// 输出 
assign hsync = h_sync_reg; 
assign vsync = v_sync_reg; 
assign pixel_x = h_count_reg; 
assign pixel y = v count reg; 
assign p. tick = pixel tick; 
endmodule 


13.2.5 测试 电路 


为 了 验证 同步 电路 的 工作 ， 我 们 可 以 将 rgb 信和 号 连接 到 3 个 开关 量 上 。 整 个 
的 可 视 区 域 应 该 由 一 种 颜色 开启 。 我 们 可 以 仔细 检查 八 种 可 能 的 组 合 来 验证 表 
13-1 中 的 颜色 定义 。HDL 代码 在 示例 13.2 中 展示 。 如 13. 2.4 节 中 提 到 的 ， 一 
个 输出 缓存 添加 到 rgb 信号 中 。 
示例 13.2 VGA 同步 测试 电路 


module vga_test 
( 
input wire clk, reset, 
input wire [2: 0] sw, 
output wire hsyne, vsync, 
output wire [2: 0 ]rgb 
)3 
// eB] 
reg [2: O]rgb reg; 
wire video on; 
// 例 化 vga 同步 电路 
vga sync vsync unit 
(. elk(clk),. reset(reset),. hsync(hsync),. vsync(vsync), 
. video on(video on),. p tick(),. pixel x(),. pixel y()) ; 
//rgb BAF 
always @ ( posedge clk, posedge reset) 
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if ( reset) 
rgb reg <=0; 
else 
rgb reg <=sw; 
ЕЕ 
assign rgb = (video on) ? rgb reg: 3'b0; 
endmodule 


13.3 ”像素 生成 电路 概述 


像素 生成 电路 为 VGA 端口 生成 了 3bit rgb 信号 。 外 部 控制 以 及 数据 信号 详细 
说 明了 屏 中 的 内 容 ， 以 及 vga sync 电路 输出 的 pixel. x 和 pixel. y 信号 提供 了 当前 
像素 的 坐标 。 为 了 便于 我 们 的 谈论 ， 我 们 将 电路 分 为 3 个 宽泛 的 种 类 : 

e 位 图 配置 ; 

e 块 图 配置 ; 

e 对 象 图 配置 。 

在 一 个 位 图 配置 中 ， 一 个 视频 存储 器 用 来 存储 将 在 屏 上 显示 的 数据 。 每 个 屏 
内 像素 直接 映射 到 存储 器 的 一 个 字 中 ，pixel_x 和 pixel. y 信号 来 自 地 址 数据 。 
像 处 理 电 路 持续 不 断 地 更 新 屏幕 并 将 相关 数据 写 进 视频 存储 器 。 恢 复 电 路 不 断 地 
读 取 视频 存储 器 并 且 发 送 数 据 到 rgb 信号 。 这 种 方案 已 应 用 于 当今 高 性 能 的 视频 
控制 器 中 。 对 于 640 x480 分 辨 率 ， 在 一 个 屏幕 上 有 大 约 310 000 即 640 x 480 个 
像素 点 。 对 于 黑白 显示 ， 这 转化 为 310 000 个 存储 器 比特 ， 而 对 于 彩色 显示 则 将 
转化 为 930 000 个 存储 器 比特 。 一 个 位 图 系统 例子 将 在 13.5 节 中 讨论 。 

为 了 减少 对 存储 器 的 需求 ， 一 种 可 供 选 择 的 方法 是 使 用 块 图 配置 。 在 这 个 方 
案 中 ， 我 们 收集 一 组 比特 组 成 一 个 块 并 将 每 一 块 作为 一 个 显示 单元 。 例 如 ， 我 们 
可 以 定义 一 个 8 x8 像素 ( 即 64 个 像素 点 ) 为 一 块 。640 x 480 的 像素 导向 屏 就 变 
成 了 80 x60 的 块 导 向 屏 。 这 样 就 只 需要 4800 也 就 是 80 x60 个 字 作 为 块 存储 器 。 
每 个 字 的 比特 数 则 取决 于 块 类 型 的 数目 。 例 如 ， 如 果 有 32 种 块 类 型 ， 那 么 每 个 
字 就 应 该 包含 Sbit， 那 么 块 存储 器 的 大 小 就 是 大 约 24 000( 即 5 x 4800) bit。 块 图 
系统 通常 需要 一 个 ROM 来 存储 块 类 型 。 我 们 称 它 为 类 型 存储 器 。 假 设 使 用 前 例 
提 到 的 单 色 类 型 。 每 一 个 8 x8 块 类 型 需要 64bit， 整 个 32 种 类 型 则 需要 2000 (为 
8 x8 x32)bito 最 终 整 体 存储 器 需求 大 约 为 26 000bit， 远 小 于 位 图 配置 的 
310 000bit。 在 第 14 章 讨论 的 文本 显示 就 是 基于 这 个 系统 。 

针对 一 些 应 用 ， 视 频 显示 可 以 非常 简单 并 且 只 包含 一 些 对 象 。 代 替 浪 费 存 储 
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器 存储 大 多 数 的 空白 屏 ， 我 们 可 以 使 用 简单 的 对 象 生成 电路 来 生成 这 些 对 象 。 我 
们 把 这 种 方法 叫做 对 象 图 配置 。 一 个 对 象 图 案例 在 13. 4 节 中 讨论 。 

这 三 种 配置 可 以 混合 在 一 起 来 生成 一 个 完整 的 屏 。 例 如 ， 我 们 可 以 使 用 位 图 
配置 来 生成 背景 而 后 使 用 对 象 图 配置 来 产生 主要 的 对 象 。 同 样 ， 对 一 部 分 屏幕 ， 
我 们 可 以 使 用 位 图 配置 来 对 另 一 部 分 屏幕 使 用 块 图 。 


13.4 使 用 对 象 映 射 图 的 图 像 生 成 


对 象 图 像素 产生 电路 包括 3 个 对 象 ， 其 概念 图 如 图 13-6 所 示 。 此 图 包含 3 
个 对 象 产 生 电路 和 一 个 RGB 信号 选择 和 传送 电路 。 一 个 对 象 生成 电路 完成 以 下 
任务 : 

e 保持 当前 对 象 坐标 ， 并 且 与 由 信号 pixel x 与 pixel. y 提供 的 当前 扫描 位 置 
进行 比较 ; 

e 如 果 当 前 扫描 位 置 属于 该 区 域 ， 将 信号 obj i on 置 位 以 表示 当前 扫描 位 
置 在 第 i 个 对 象 的 区 域 上 ， 并 且 这 个 对 象 应 该 被 开启 ; 

e 信号 obj_i_rgb 指定 期 望 的 颜色 。 


数据 /控制 
video_on 
pixel x 
pixel y — —34 





rgb 














图 136 像素 生成 映射 原理 图 


RGB 选择 器 依据 其 内 部 优选 策略 进行 选择 操作 。 它 需要 检查 多 个 obj_i_on 
信号 并 且 决 定 哪 个 obj_i_rgb 信号 将 发 送 到 RGB 输出 端 。 当 多 个 obj_i_on 信号 同 
时 置 位 时 ， 优 选 策略 决定 了 显示 命令 的 先后 顺序 。 它 会 相应 选择 一 个 对 象 作为 前 
景 。 
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我 们 使 用 一 个 简单 化 乒乓 游戏 来 举例 说 明 多 种 图 像 生成 策略 。 被 创建 的 设计 
如 下 : 

1) 用 一 个 矩形 物体 创建 一 个 简单 静止 的 屏幕 。 

2) 添加 一 个 圆 形 物体 。 

3) 引入 激励 。 

4) 添加 得 分 和 信息 文本 。 

5) 创建 一 个 顶层 控制 电路 。 

前 三 个 步骤 在 本 节 中 进行 介绍 ， 后 两 个 步骤 在 第 14 章 进行 介绍 。 


13.4. BWR 


200 T 8JEXES APA EBE ЕАН RAIL А ET ел о PE 
屏幕 如 图 13-7 所 示 ， 它 包括 3 个 对 象 : He EE PAM ARMAS). BRAC APA 
侧 垂直 的 短 木 条 ) 和 一 个 方形 球 。 屏 幕 中 显示 区 域 的 坐标 如 图 所 示 。 需 注意 y_ax- 
is 是 向 下 增长 的 。 





479 
Ж Ж 
Уй 球拍 (bar) 


图 13-7 ”依旧 是 乒乓 游戏 画面 


首先 让 我 们 分 , 墙 条 纹 的 生成 。 为 了 表示 明确 ， 在 代码 中 ,我们 定义 相关 的 
边界 和 尺寸 为 常量 。 此 墙 的 部 分 实现 代码 为 

// А, # Ju) 2: 

localparam WALL X L=32; 

localparam WALL X L =32; 
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// RRE 

assign wall on - (WALL X L <=pix_x) &&(pix x <= WALL X К) 

// SAY RGB 输出 

assign wall гер 23' b001; // HE 

墙 是 一 个 4 个 像素 宽度 的 垂直 条 纹 ， 在 32 列 -35 列 之 间 ， 被 定义 为 WALL_ 


X L fll WALL X_R， 用 于 分 别 表 示 墙 左 侧 和 右 侧 在 х 轴 中 的 坐标 。 这 个 对 象 有 
两 个 输出 信号 : wall on 和 wall_rgb。 信 和 号 wall on 表示 墙 应 该 开启 ， 在 当前 水 平 
扫描 在 这 个 区 域 中 时 ， 信 和 号 wall on 被 置 位 。 因 为 此 条 纹 覆盖 了 整个 垂直 列 ， 对 
T y_axis 的 边界 是 没有 需求 的 。 信 和 号 wall_rgb 表示 墙 的 颜色 是 “001”( 蓝 色 ) 。 


对 于 木 条 的 部 分 实现 代码 如 下 : 

// KREM, т A 

localparam BAR. X L 2600; 

localparam BAR. X К 2603; 

// ЖАНЕ, JG: 

localparam BAR Y SIZE - 72; 

` localparam BAR. Y T2 MAX Y/2-BAR Y SIZE/2; //204 
localparam BAR Y В = ВАК Y T-«BAR Y SIZE 1; 


// ЖЖЖ 

assign bar on = (BAR X L«- pix x) && (pix x «- BAR X R) && 
(BAR, Y T <= pix y) && (pix у <= BAR Y B); 

// KA RGB 输出 

assign bar тер 23' b010; // 绿色 

除了 包括 y axis 边界 ， 球 拍 的 代码 实现 和 实现 墙 代码 是 一 致 的 。 球 拍 期 望 的 


垂直 长 度 为 72 个 像素 ， 定 义 为 BAR_Y_SIZE。 因 为 我 们 希望 把 球拍 放置 在 中 间 ， 
球拍 项 部 边界 被 定义 为 BAR_Y_T， 是 y 轴 最 大 长 度 的 一 半 减 去 球拍 长 度 的 一 半 。 
球拍 底部 边界 是 球拍 项 部 边界 加 球拍 的 长 度 。 信 号 bar on 的 产生 类 似 于 wall_on 
信号 ， 但 是 垂直 扫描 必须 在 y_axis 的 边界 内 。 


球 的 代码 可 以 通过 类 似 的 方式 进行 创建 。 最 后 的 代码 是 多 路 选择 器 电路 ， 用 


于 检查 3 个 对 象 中 开启 的 信号 并 发 送 相应 的 RGB 信和 号 到 输出 端 。 代 码 如 下 : 


always@ +* 
if( ~ video on) 
graph тер 23'b000; // ZÁ 
else 
if( wall on) 
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graph_rgb = wall_rgb; 
else if( bar_on) 
graph rgb = bar rgb; 
else if(sq ball on) 
graph rgb = ball rgb; 
else 
graph тер 23' b110; // 黄色 背景 
电路 首先 检查 video on 是 否 被 置 位 ， 如 果 是 ， 循 环 检查 3 个 开启 信号 。 当 其 
中 一 个 开启 信号 被 置 位 ， 表 示 扫 描 在 区 域内 ， 并 且 发 送 相应 的 RGB 信号 到 输出 
端 。 如 果 没 有 信号 被 置 位 ， 扫 描 将 处 于 “ 背景" 模式， 并 且 输 出 被 置 于 “110”( 黄 
色 )。 
全 部 的 HDL 代码 实现 如 示例 13. 3 所 示 。 
示例 13.3 对 于 乒乓 游戏 画面 的 像素 生成 电路 


module pong_graph_st 

( 
input wire video_on, 
input wire [9: 0] pix x, pix y, 
output reg [2: 0] graph rgb 

s 

// 常量 和 信号 声明 

//x , y MARKO, 0) 到 (639, 479) 

localparam MAX X =640; 

localparam MAX Y =480; 


// ERAS ШЖ mu: 
localparam WALL X L 232; 
Іосаірагат WALL X К =35; 


// 球拍 左 侧 和 石 侧 边 界 
localparam BAR X L =600; 
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localparam BAR, X К =603; 

// 球拍 项 部 和 底部 边界 

localparam BAR Y SIZE -72; 

localparam BAR Y T = MAX Y/2-BAR Y SIZE/2; //204 
localparam BAR Y B = BAR Y T + BAR Y SIZE-1; 


localparam BALL SIZE -8; 

А РАКАТ AA 

Іосаірагат BALL X І, = 580; 

Іосаірагат BALL X Е = BALL X L + BALL SIZE-1; 
// 立方 体 硕 部 和 底部 边界 

localparam BALL Y T =238; 

localparam BALL Y B - BALL Y T + BALL SIZE-1; 


wire wall on, bar on, sq ball on; 
wire [2: 0] wall rgb, bar rgb, ball rgb; 
// 实体 


ВЖ 

assign wall on = ( WALL X L <=ріх х) && (pix х<= WALL X К); 
// 墙 的 RGB ji 

assign wall rgb =3’ b001; // Kf 


// PREAH Ж 

assign bar on = (BAR_X_L <=pix_x) && (pix x «- BAR X К) && 
(BAR Y T «-pix y) && (pix y «- BAR Y B); 

// 球拍 RGB 输出 
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assign bar rgb =3’ 010; // 绿色 


// EHRE 
assign sq ball on = 
(BALL X І, «-pix x) && (pix x «- BALL X В) && 
(BALL Y T «- pix y) && (pix y «- BALL Y B); 
assign ball грр =3' b100; — // 红色 


—X—— -=-= 
// RGB 选择 带电 路 
//-------------------------------------------- 
always @ * 
if ( — video_on) 
graph гор -3' b000; // 254 
else 
if ( wall on) 
graph rgb - wall rgb; 
else if (bar on) 
graph rgb = bar rgb; 
else if (sq ball on) 
graph rgb = ball rgb; 
else 
graph rgb =3’ b110; // RHA 
endmodule 


从 像素 产生 电路 得 到 相应 的 信号 后 ， 我 们 将 其 连接 到 УСА 同步 电路 从 而 创 
建 完 整 的 视频 接口 。 顶 层 的 HDL 代码 如 示例 13.4 所 示 。 注 意 ， 信 和 号 graph_rgb 
是 通过 输出 缓冲 区 buffer 连接 到 输出 端的 。 当 信号 pixel tik 被 置 位 时 ， 它 将 被 
取出 。 该 输出 端 缓冲 器 用 于 与 已 缓冲 的 水 平 同 步 和 垂直 同步 信号 同步 。 

示例 13.4 依旧 是 对 于 一 个 乒乓 游戏 画面 的 完整 电路 


module pong top st 
( 


input wire clk, reset, 
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output wire hsync, vsync, 
output wire [2: 0]rgb 

js 

// 信号 声明 

wire [9: 0] pixel x, pixel y; 

wire video on, pixel tick; 

reg [2: O]rgb reg; 

wire [2: O]rgb next; 

// 实体 

// vga 同步 电路 例 化 

vga sync vsync unit 
( . clk( clk) ,. reset( reset) ,. hsync( hsync) ,. vsync( vsync) , 
. video on(video on),.p tick( pixel бск), 
. pixel x( pixel x) ,. pixel y(pixel y)) ; 

// 图 形 生 成 电路 例 化 

pong graph st pong grf unit 
(. video on(video on),.pix x(pixel x) ,. pix y(pixel y) , 
. graph rgb(rgb. next) ) ; 

//RGB 22| 

always @ ( posedge clk) 
if ( pixel tick) 

rgb reg «-rgb next; 
// 输出 


assign rgb = гор reg; 


endmodule 


13.4.2 非 矩 形 对 象 


直接 检测 非 矩形 对 象 的 边界 是 非常 困难 的 。 一 个 可 行 
的 办 法 是 把 对 象 图 案 使 用 位 图 的 方式 进行 详细 说 明 ， 并 且 
通过 位 图 生成 RGB 信号 和 开启 信号 。 为 了 更 好 地 解释 ， 我 
们 举 个 例子 。 假 设 我 们 想 要 在 兵 乓 球 游戏 屏幕 中 显示 一 个 
球 ， 如 图 13-8 所 示 ， 使 用 像素 为 8 x8 贺 形 位 图 表示 。 这 个 
圆 形 对 象 生成 的 步 又 如 下 : ni 
。 检查 扫描 坐标 是 否 在 8 x8 像素 块 中 ; TOM 
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e 如 果 是 ， 从 位 图 中 获取 相应 的 像素 ; 

e 使 用 重新 获得 的 像素 点 为 圆 形 对 象 产生 RGB 信号 和 开启 信号 。 

为 了 执行 此 方案 ， 我 们 不 得 不 包含 一 个 图 像 ROM 来 存储 位 图 和 一 个 地 址 映 
射电 路 用 于 将 扫描 坐标 转换 成 ROM 的 行 和 列 。 

为 了 适应 此 变化 ， 示 例 13.3 的 部 分 代码 必须 修改 。 首 先 ， 我 们 使 用 CASE 
语句 为 这 个 圆 形 定义 一 个 图 像 ROM， 可 参考 示例 12.5: 

wire[2 : 0] гот addr; 

reg[7: 0] rom data; 


// (ATE VR 
always @ * 
case(rom _addr ) 
3' h0: rom data =8’ b00111100; // 


ж ж ож ж 
3'hl; rom data =8'b01111110; // * ж ож ж ж OK 
3'h2; rom_data =8'b11111111; // жжжжж=жжж» 
3'h3. rom_data =8'b11111111; // * ж ж x ж ж ж ж» 
3'h4: rom_data =8'b11111111; // ж ж ж ж ж ж ж ж 
3'һ5; rom data -8'bllllllll; // жж x sx ж ж ж ж 
3' h6. rom data =8 b01111110; // * жож ож ож ж 
3' h7. rom data =8'b00111100; // k жож ж 


endcase 


然后 ， 我 们 扩展 这 个 球状 物 生 成 代码 以 包括 圆 形 位 图 的 映射 。 为 了 方便 以 后 
表示 活动 物体 ， 我 们 仍旧 使 用 信号 来 蔡 代 球状 物 边 界 的 常数 。 其 修改 后 的 代码 如 
F: 

// (TERR 

assign sq_ball _on = 

(ball x | <= pix x ) && (pix x <= ball x r) && 
(ball y t <= pix y) &&( pix у «- ball y b); 

// 将 当前 的 像素 映射 到 ROM 中 的 地 址 

assign rom addr =pix_y[2: 0]-ball y t[2: 0]; 

assign rom col = pix x[2: 0] - ball x 1 [2: 0]; 

assign rom bit = rom data [ rom col] ; 

// ЖИВ 

assign rd ball on = $9 ball on & rom bit; 

// 球状 物 RGB fiih 
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assign ball гер =3’b100; // 红色 

第 一 个 语句 用 于 检查 当前 扫描 区 域 是 否 在 圆 形 区 域内 ， 从 而 判定 是 否 将 信和 号 
sq ball on 置 位 。 除 了 信和 号 用 于 表示 边界 外 ， 这 段 代码 和 示例 13. 3 类 似 。 第 二 段 
代码 表示 通过 当前 的 扫描 点 获得 ROM 中 相应 的 位 。 如 果 扫 描 点 在 圆 形 区 域内 ， 
需 减 去 顶部 边界 (ball_y_t) 的 低 三 位 用 于 表示 ROM 中 相应 的 行 位 置 (rom_addr) ; 
减 去 左 侧 边界 (ball_x_1) 的 低 三 位 用 于 表示 ROM 中 相应 的 列 。 通 过 相应 的 数组 获 
得 最 终 的 位 。 然 后 通过 和 信和 号 sq ball on 进行 组 合 逻辑 后 产生 信和 号 rd_ball_on。 
这 个 设计 中 仅 使 用 了 单 色 表示 圆 形 区 域 。 我 们 可 以 将 图 像 ROM 复制 3 份 用 于 存 
储 每 个 像素 ， 并 且 可 产生 多 种 颜色 的 球体 。 

最 后 ， 我 们 需要 在 选择 器 电路 中 做 一 个 小 的 修正 ， 用 信和 号 rd_ball_on 代替 信 
号 sq ball on: 


else if( rd ball on) 
graph rgb = ball rgb; 


在 下 一 节 中 ， 这 些 修改 将 会 组 合 进 活动 的 画面 。 
13.4.3 活动 的 对 象 


当 一 个 对 象 在 每 次 扫描 中 逐渐 地 改变 其 位 置 ， 它 看 起 来 就 像 是 移动 的 。 为 了 
达到 此 效果 ， 我 们 使 用 寄存 器 来 存储 对 象 的 边界 并 且 在 每 次 扫描 时 更 新 它 的 值 。 
在 游戏 中 ， 木 条 被 两 个 按钮 控制 ， 可 以 移 上 和 移 下 ; 球体 可 以 在 任何 方向 上 移动 
和 弹跳 。 在 本 节 中 我 们 将 举例 说 明 怎样 创建 这 两 个 对 象 的 动画 。 

尽管 VGA 控制 器 的 驱动 频率 为 25MHz, 但 是 VGA 监视 器 屏幕 的 刷新 频率 仅 
DUX 60 次 /s。 边 界 寄存 器 只 需要 在 这 个 速率 下 更 新 。 我 们 创建 一 个 60Hz 的 使 能 
信号 refr_tick, 4 1/60s 置 位 一 次 。 

首先 让 我 们 考察 木板 的 设计 。 为 了 适应 变化 的 y 坐标 ， 我 们 使 用 信号 bar_y_ 
t 和 bar y b 替代 常量 来 描述 顶部 和 底部 边界 ， 并 且 创 建 一 个 寄存 器 bar y reg Ж 
存储 当前 顶部 边界 的 y 坐标 。 当 其 中 一 个 按钮 按 下 ， 寄 存 器 bar_ y reg 在 refr tick 
信和 号 被 置 位 时 会 以 固定 值 增加 或 减少 。 这 个 固定 值 定义 为 常量 BAR_V， 且 代表 
木板 的 速度 。 我 们 假设 bn[1] 和 btn[ 0 ] 的 置 位 分 别 表示 木板 的 上 升 和 下 降 ， 并 
且 当 木板 到 达 屏 幕 的 顶部 和 底部 边界 时 停止 运动 。 更 新 寄存 器 bar_y_reg 的 部 分 
代码 如 下 : 

// B Ki y 坐标 

always@ * 

begin 
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bar y next = bar y reg;// 不 移动 
if( гет tick) 
if( btn[ ll&(bar y b «(MAX Y 1 BAR V))) 
bar y next = bar y reg + BAR. V;// FÆ 
elseif( btn[ Ol&(bar y t» BAR V)) 
bar y next = bar y reg BAR V;// 上 移 
end 
球状 物 的 设计 是 相对 困难 的 。 我 们 必须 使 用 4 个 信号 代替 4 个 边界 常量 ， 并 
且 创 建 2 个 寄存 带 ball x reg 和 ball. y reg 用 于 存储 当前 左边 和 顶部 边界 的 x 和 yy 
坐标 。 球 状 物 通常 匀速 运动 (速度 和 方向 都 是 固定 的 ) 。 当 撞击 到 墙 、 木 板 、 屏 
幕 的 顶部 或 底部 时 ， 它 会 改变 方向 。 我 们 将 速度 分 解 为 x 分 量 和 y 分 量 ， 它 们 的 
值 要 么 是 正 数 BALL_V_P， 要 么 是 负数 BALL_V_N。 两 个 分 量 当前 的 值 存储 于 x_ 
delta reg 和 y_delta_reg 寄存 器 中 。 更 新 ball x reg 和 ball y reg 寄存 器 的 部 分 代 
fit F: 


// 当前 球 的 位 置 

assign ball x next = (refr tick) ? ball x reg + х дена тев: 
ball x reg; 

assign ball y next = (refr tick) ? ball y reg y. delta reg: 
ball y reg; 

TH jr x delta reg Ж y delta reg 寄存 器 的 代码 如 下 : 

// 当前 球 的 速度 

always Q * 

begin 


x delta next 2x delta reg; 

y. delta next = y delta reg; 

if(ball y t <1)// 到 达 顶 部 
y delta next = BALL V P; 

elseif( ball y b» (MAX Y 1))// 到 达 底 部 
y. delta next = BALL V N; 

elseif( ball x 1 <= WALL X R)// 到 达 墙 
x delta next = BALL V. P;// ## [n] 

elseif( (BAR X І, <= ball x г) &&(ball x r«- BAR X К) && 
(bar y t <= ball y b) &&(ball y t <= bar y b)) 
// SJ EB h E WAAR, ERIK IRI 
x delta next = BALL V N; 
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end 
TE: 如 果 球 未 触及 木板 ， 球 将 继续 向 右 部 区 域 移动 。 
完整 的 代码 见 示例 13. 5。 


示例 13.5 对 于 乒乓 游戏 动画 的 像素 生成 电路 


module pong_graph_animate 
( 
input wire clk, reset, 
input wire video_on, 
input wire [1: 0]btn, 
input wire [9: 0] pix x, pix y, 
output reg [2: 0] graph rgb 
Mr 
// 第 量 和 信号 声 盟 
//x, y 的 坐标 为 (0 , 0 ) (639 , 479 ) 
localparam MAX_X =640; 
localparam MAX Y =480; 
wire refr tick; 


// 墙 的 左 、 右 边界 
localparam WALL X L =32; 
Іосаірагат WALL X К =35; 


// 右 侧 垂 直木 条 左右 侧 边 界 
localparam BAR_X_L =600; 
localparam BAR_X_R =603; 

// 本 条 硕 部 和 底部 边界 

wire [9: 0] bar y t, bar y b; 
localparam BAR Y SIZE -72; 

// RR MRBU AP BU By fer ( x EREE) 
reg [9: 0] bar y reg, bar y next; 
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// 当 开 关 打 开 肝 木板 的 移动 速度 
localparam BAR_V =4; 


localparam BALL SIZE =8; 
ЖАШ Ж 

wire [9: 0] ball x 1, ball х r; 

// 立方 体质 部 ， 底 部 边界 

wire [9: 0] ball y t, ball y b; 

// BAS A DIRUTA FFF AE 

reg [9: 0] ball x reg, ball y reg; 
wire [9: 0] ball x next, ball y next; 
// xs ВЕН Sy FF d 

reg [9: 0] x delta reg, x delta next; 
reg [9: 0] y delta reg, y delta next; 
// 立方 体 的 速度 可 为 正 或 负 
localparam BALL V P =2; 

localparam BALL V N =-2; 


wire [2: 0] rom addr, rom col; 
reg [7: 0] rom data; 
wire rom bit; 


wire wall on, bar on, sq ball on, rd ball on; 
wire [2: 0] wall rgb, bar rgb, ball rgb; 
// 实体 


always @ + 
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case ( rom_addr ) 
3'h0: rom data -8' 00111100; // = s х x 
3'hl: rom data -8'b01111110; // х k x x ж x 
3' h2: rom data -8'b11111111; // s s s s ж ж ж ж 
3' h3: rom data -8'bl1111111; // x * x k ж ж ж ж 
3' hd: rom data -8' b11111111; // жож ж ж ж x ж ж 
3' h5: rom data -8' bl11111111; // s ж x ж ж ж ж ж 
3' h6: rom data -8'b01111110; // є x s s ж ж 
3' h7: rom data -8' b00111100; // х x ж x 
endcase 
// SE dE 
always @ ( posedge clk, posedge reset) 
if ( reset) 
begin 
bar_y_reg <=0; 
ball_x_reg <=0; 
ball_y_reg <=0; 
x delta reg <=10’ h004; 
y delta reg <=10’ h004 ; 
end 
else 
begin 
bar y reg «-bar y next; 
ball x reg «- ball x next; 
ball y reg «- ball y next; 
x delta reg «-x delta next; 
y delta reg «-y delta next; 
end 
// TBÉSELIGOHz 刷新 频率 有 时， 在 v_sync 的 开始 同时 refr_tick BER 
assign refr tick = (pix y ==481) && (pix х==0); 


// RRK 
assign wall on = (МАШ, X L «- pix x) && (pix x <= WALL X К); 
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// TÉ RGB 输出 
assign wall rgb =3' b001; // # & 


// 边界 
assign bar y t- bar y reg; 
assign bar y b=bar y t x BAR Y SIZE - 1; 
// жанв 
assign bar on = (ВАК X L «- pix x) && (pix x <= BAR X К) && 
(bar y t «-pix y) && (pix y «-bar y b); 
// 木 条 的 RGB 输出 
assign bar_rgb =3’ b010; // 绿色 
// new bar y-position 
always @ + 
begin 
bar y next =bar_y_reg; // 不 移动 
if ( refr tick) 
if (btn[1] & (bar y b < (MAX Y-I-BAR V))) 
bar y next = bar y reg + ВАК V; // FÆ 
else if (btn[0] & (bar y t » BAR V)) 
bar y next = bar y reg - BAR V; // F# 


// 边界 

assign ball x 1 = ball x reg; 

assign ball y t- ball y reg; 

assign ball x г = ball x 1+ BALL SIZE - 1; 

assign ball y b = ball y t + BALL SIZE - 1; 

// 球 的 像素 

assign sq_ball_on = 
(ball х 1 <=pix х) && (pix x <=ball_x_r) && 
(ball y ё <= pix y) && (pix y «-ball y b); 
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// PRIS SHOR LEA ROM 中 的 行列 

assign rom addr = pix y[2: 0] - ball y t[2: 0]; 
assign rom col = pix x[2: 0] - ball x 1[2: 0]; 
assign rom bit = rom data[ rom col]; 

// ERIRE 

assign rd ball on -sq ball on & rom bit; 

// BRAY RGB 输出 

assign ball rgb -3'b100; // 红色 


// 当前 球 的 位 置 

assign ball x next = (refr tick) ? ball x reg + х delta гер. 
ball x reg; 

assign ball y next = (refr tick) ? ball у reg--y delta гер. 
ball y reg; 

// "fBlERBUZE ВЕ 

always @ x 

begin 


х delta next 2x delta reg; 
y delta next = y delta reg; 
if (ball y t < 1) // 到达 项 部 
y delta next = BALL V P; 
else if (ball y b > (MAX Y-1)) // 到 达 底 部 
y delta next = BALL V N; 
else if (ball x 1 <= WALL X К) // ФАШ 
x delta next - BALL V P; // 3% [а] 
else if ((BAR X L «- ball x г) && (ball x r <= BAR X К) && 
(bar y t «-ball y b) && (ball y t«-bar y b)) 
// SUAE h r DK e, BR GH E 
x delta next = BALL V N; 


always @ * 
if ( — video on) 
graph rgb -3' b000; // ZÁ 
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else 
if ( wall on) 
graph rgb - wall rgb; 
else if (bar on) 
graph гор = bar rgb; 
else if ( rd ball on) 
graph rgb = ball гер; 
else 
graph гер =3’ b110; // RA AE 
endmodule 


和 静止 屏幕 一 样 ， 我 们 可 以 连接 同步 电路 ， 并 且 创 建 顶层 描述 。HDL 代码 
如 示例 13. 6 所 示 。 
示例 13.6 活动 屏幕 的 完整 电路 


module pong_top_an 
( 
input wire clk, reset, 
input wire [1: 0]btn, 
output wire hsync, vsync, 
output wire [2: 0]rgb 
J3 
// fp: HJ 
wire [9: 0] pixel x, pixel y; 
wire video on, pixel tick; 
reg [2: O]rgb reg; 
wire [2: O]rgb next; 
// 实体 
// 例 化 VGA 同步 电 有 路 
vga_sync vsync_unit 
(. clk( сік), . reset( reset), .hsync(hsync), . vsync( vsync), 
. video on( video on), . p tick(pixel tick) , 
. pixel. x( pixel х), . pixel y(pixel y)) ; 
// PALE LBP A dE 


pong_graph_animate pong_graph_an_unit 
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(. clk(clk) . reset( reset), . btn( btn), 
. video on( video on), . pix x(pixel x) , 
. pix y(pixel y), . graph rgb(rgb next) ) ; 
// RGB £z nh 
always € ( posedge clk ) 
if ( pixel tick) 
rgb reg «-rgb next; 
// 输出 
assign rgb = rgb reg; 
endmodule 


TE: 在 此 代码 中 无 其 他 的 控制 机 制 ， 球 仅 是 持续 不 断 地 简单 移动 和 弹跳 。 顶 
层 控制 电路 将 在 第 14 章 介绍 。 


13.5 位 图 映射 的 图 像 生成 


位 映射 将 每 个 像素 点 映射 成 视频 存储 器 中 的 一 个 字 节 。 在 分 辨 率 为 640 x 
480 的 屏幕 中 约 含有 310K 个 像素 。 可 以 分 别 转换 成 310K 用 于 单 色 显示 或 是 
930K 用 于 彩色 显示 。 视 频 存储 器 的 实际 容量 应 该 更 大 ， 因 为 存储 地 址 必须 适当 
组 合 以 便于 快速 存 取 。 例 如 ， 将 像素 的 当前 坐标 映射 到 存储 器 中 的 位 置 ， 我 们 可 
以 连接 位 宽 为 10 位 的 x 坐标 和 位 宽 为 9 位 的 y 坐标 。 这 个 步骤 不 需要 额外 的 电 
路 将 像素 的 坐标 转换 为 存储 地 址 ， 而 是 传人 存储 器 中 没有 使 用 的 空间 。 存 储 器 的 
容量 大 小 应 由 310K 字 节 上 升 至 512K r, 

对 于 S3 电路 板 ， 如 第 11 章 和 第 12 章 介绍 的 ， 存储 器 可 以 使 用 外 部 SRAM 
芯片 或 者 FPGA рун КАМ, 283] Spartan 35200 系列 芯片 中 的 RAM 块 的 容 
量 仅 有 192kbit/s。 对 于 整个 屏幕 显示 的 位 图 容量 是 不 够 的 。 为 了 达到 目的 ， 我 
们 必须 使 用 外 部 的 8M bits 的 SRAM. 

在 本 节 中 ， 我 们 使 用 一 个 小 的 128 x 128 的 屏幕 区 域 来 举例 说 明 位 图 方案 的 
设计 。 这 个 屏幕 有 16K(2" ) 个 像素 ， 并 且 需 要 一 个 16 x3 的 视频 存储 器 用 于 色 
彩 显示 。 这 将 通过 3 SAK RAM 块 来 实现 。 这 个 小 区 域 是 屏幕 左上 角 的 部 分 ， 
用 于 显示 一 个 活动 的 像素 点 的 轨迹 ， 如 图 13-9 所 示 。 这 个 电路 使 用 了 一 个 3 位 
的 用 于 指定 轨迹 颜色 的 开关 ， 和 一 个 用 于 随机 选择 轨迹 起 点 的 按钮 开关 。 当 按钮 
开关 被 按 下 时 ， 这 个 点 开始 移动 ， 就 像 13. 4. 3 节 中 活动 的 球 。 在 这 个 点 撞击 这 
个 区 域 中 的 4 个 边 后 ， 轨 迹 形 成 矩形 。 在 按钮 开关 被 按 下 的 每 个 时 刻 ， 将 产生 新 
的 轨迹 。 
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图 13-9 fE 128 x128 的 位 图 中 的 轨迹 点 


13.5.1 WO RAM 实现 


XU RAM 实现 的 原理 图 如 图 13-10 所 示 ， 视 频 存 储 器 是 一 个 同步 的 16K х3 
(2”x3) 的 双 口 RAM。 双 口 模块 ( 详 见 示 例 12. 4) 可 以 用 于 实现 双 口 RAM。 存 储 
器 的 高 7 位 地 址 是 像素 y 坐标 的 低 7 位 ， 存 储 器 的 低 7 位 地 址 是 像素 x 坐标 的 低 
7 位 。dot_xy 电路 用 于 跟踪 圆 点 的 轨迹 ， 并 且 产 生 当前 的 坐标 x 和 坐标 y， 并 将 
两 者 联合 作为 写 地 址 。 信 号 sw 为 外 部 开关 输入 ， 位 宽 为 3 位 ， 用 于 表示 RGB 的 
值 ， 和 存储 器 的 din_a 端口 相连 ， 像 素 y 的 低 7 位 和 像素 x 的 低 7 位 构成 了 读 地 
址 。 数 据 不 断 重 新 获取 并 且 将 相应 的 数据 发 送 给 RGB 选择 器 电路 。 

了 14 
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PA 13-10 轨迹 点 电路 原理 图 
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圆 点 轨迹 像素 产生 电路 的 完整 代码 如 示例 13.7 所 示 。 我 们 使 用 两 个 寄存 器 
dot. x reg 和 dot. y reg 来 表示 圆 点 轨迹 当前 的 坐标 x 和 坐标 y， 使 用 两 个 寄存 器 
v_x_reg 和 v y reg 表示 当前 轨迹 的 水 平和 垂直 速度 。 圆 点 坐标 值 和 速度 的 计算 方 
法 和 13. 4. 3 节 中 计算 反弹 球 的 方式 类 似 。 除 此 之 外 ， 数 据 会 定时 更 新 ， 在 按钮 
开关 开启 时 ， 信 号 dot_x_next 和 信号 dot_y_next 获取 pix x 和 pix y 的 低 7 位 。 由 
于 这 些 信 号 的 变化 比 人 的 感知 要 快 很 多 ， 因 此 新 坐标 可 以 是 随机 值 。 

示例 13.7 128 x128 位 图 像素 产生 电路 


module bitmap_gen 
( 
input wire clk, reset, 
input wire video on, 
input [1; 0]btn, 
input [2; 0] sw, 
input wire [9; 0] pix x, pix y, 
output reg [2: 0] bit rgb 
Tr 
// E A УННН] 


wire refr tick, load tick; 


wire we; 
wire [13: O]addr г, addr м; 
wire [2: 0] din, dout; 


localparam MAX X = 128; 
localparam MAX Y = 128; 

// [Bl iE BE n] 22 1E n] 2 f 
localparam DOT V P =1; 
localparam DOT V N = -1; 

// Blk PAE P Ey dE 

reg [6: 0] dot x reg, dot y reg; 
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wire [6: 0] dot x next, dot y next; 
// [BL ERE A E t 
reg [6: 0] v x reg, v y reg; 


wire [6; 0] v x next, v y next; 


wire bitmap on; 
wire [2: 0] bitmap rgb; 
// 实体 
// Arse EAE Ske IB EA 
debounce deb. unit 
(. elk(clk) , .reset(reset) , . sw(btn[0]), 
. db level( ) , . db tick(load tick) ) ; 
// PEILE RAM 
xilinx. dual port ram sync 
#(. ADDR. WIDTH(14) ,. DATA WIDTH(3)) video ram 
(. elk( clk) ,. we( we) ,. адаг a( addr. ж) ,. addr b(addr г), 
. din, a( din) ,. dout. a( ) ,. доші b( dout) ) ; 
// 视频 RAM 接口 
assign addr у = | dot y reg,dot x reg] ; 
assign addr г = | pix y[6:0] ,pix x[6:0]] ; 
assign we = 1' bl; 
assign din = sw; 
assign bitmap rgb = dout; 
// Sf di 
always @ ( posedge clk , posedge reset) 
if (reset) 
begin 
dot x reg <=0; 
dot y reg <=0; 
v x reg <= DOT V P; 
v y reg <= DOT V P; 
end 


else 


: 376 - 用 Verilog 设计 FPGA 样机 实例 解析 (Xilinx Spartan-3 版 ) 





begin 
dot x reg <= dot x next; 
dot y reg «- dot y next; 
v x reg «-v x next; 
v y reg <=v_y_next; 
end 
// T£ v-syne 开始 的 一 个 tick 8E B f 
assign refr tick = ( pix y 2-481) && (pix x ==0); 
// fz E CHR E 
assign bitmap on = (pix x <=127) & (pix y <=127); 
// PALA B 
// >fbtn [О ] 开 启 时 ， 随 机 下 载 辕 点 位 置 
assign dot x next = (load tick) ? pix х[6: 0] : 
(refr tick) ? dot x reg + v x reg : 
dot x reg; 
assign dot y, next = (load tick) ? pix y[6: 0] : 
(тет tick) ? dot y reg + v y reg : 


dot y reg; 

// [lx x 坐标 速度 

assign v_x_next = 
(dot_x_reg==1) ? DOT V P ; // PAZE M 
(dot. x reg == (MAX_X-2)) ? DOT_V_N : // HAF fil 
v_x_reg; 

// лї y PREBE 

assign v_y_next = 
(dot_y_reg ==1) ? DOT V P : // 到 达 顶 部 
(dot y reg == (MAX_Y-2)) ? DOT_V_N : // 到 达 底 部 
у_у_тер; 

//-----------------------------------------—-- 

// RGB ZEE rH pf 

//-------------------------------------------- 

always @ x 


if ( ~ video on) 
bit rgb 23' b000; // 空白 


else 
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if ( bitmap. on) 
bit rgb = bitmap rgb; 
else 


bit rgb 23' b110; //  & ж 


endmodule 


系统 顶层 的 HDL 代码 如 示例 13. 8 所 示 。 


示例 13.8 位 图 屏幕 完整 电路 


module dot top 

( 
input wire clk, reset, 
input wire [1; O]btn, 
input wire [2; 0] sw, 
output wire hsync, vsync, 
output wire [2 ; 0 | rgb 

); 

// fz HJ 

wire [9: 0] pixel x, pixel y; 

wire video on, pixel tick ; 

reg [2: O]rgb reg; 

wire [2; O]rgb next; 

// 实体 

// 例 化 VGA Fj t tk 


vga_sync vsync_unit 


(. elk( clk) ,. reset( reset) ,. hsync( hsync) ,. vsyne( vsync) , 


. video, on( video on) ,. p. tick( pixel tick) , 
. pixel. x( pixel. x) ,. pixel. y( pixel y) ) ; 
// THEE IE dt 


bitmap gen bitmap unit 


(. elk( clk) ,. reset( reset) ,. btn( btn) ,. sw(sw) , 


. video on( video on) ,. pix x( pixel x), 
. pix. y( pixel. y) ,. bit rgb( rgb next) ) ; 
// RGB Bigs 
always @ ( posedge clk) 
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if ( pixel. tick ) 
rgb reg <= тер next; 
СЕ 
assign rgb = rgb reg; 
endmodule 


13.5.2 单口 RAM 实现 


尽管 双 口 存储 器 是 理想 的 ， 但 却 不 总 是 可 用 的 。 使 用 常规 的 单口 存储 器 ( 例 
如 S3 板 上 的 外 部 SRAM) 用 于 视频 存储 需要 注意 在 数据 获取 时 读 写 操作 间 的 冲 
突 。 为 了 说 明 此 问题 ， 我 们 将 内 嵌 的 RAM 块 配置 成 一 个 单口 同步 SRAM 并 且 重 
新 设计 之 前 的 圆 点 轨迹 电路 。 

在 圆 点 轨迹 电路 中 ， 圆 点 坐标 在 每 次 屏幕 扫描 时 更 新 一 次 。 因 此 可 以 以 这 样 
的 速度 对 视频 存储 器 进行 写 操作 。 我 们 可 以 在 因 视 频 关闭 而 垂直 线 折 回 的 这 个 期 
间 完 成 这 些 操 作 ， 并 且 不 会 发 生 视频 存储 器 写 操作 与 屏幕 数据 读 取 操作 的 冲突 。 
注意 当 pixel y 为 481 时 ， 信 和 号 refr_tick 将 被 置 位 。 在 此 位 置 时 视频 被 关 掉 ， 并 
且 写 视频 存储 器 不 会 干扰 屏幕 数据 的 重 获 取 。 我 们 使 用 we 信号 作为 单口 RAM 
的 写 使 能 。 已 经 在 示例 12.2 讨论 过 的 单口 RAM 模块 在 这 里 可 以 使 用 。 示 例 
13.7 中 的 存储 部 分 代码 现在 变 成 了 : 

// PLEX RAM 

xilinx-one-port-ram-sync 

#(. ADDR-WIDTH( 14) ,. DATA-WIDTH(3) ) video-ram 

(. elk( clk) ,. we( we) ,. addr( addr) , 

. din( din) ,. dout( dout) ) ; 

// 视频 RAM 接口 

assign addr w = (dot y reg,dot x reg) ; 

assign addr г = ( pix y C6:01 ,pix x[6:01) ; 

assign addr = ( refr tick) ? addr_w:addr_r; 

assign we = refr tick ; 

assign din = sw; 

assign bitmap. rgb = dout; 

圆 点 轨迹 电路 在 每 次 屏幕 扫描 时 更 新 一 个 像素 点 。 因 为 写 操作 需要 的 存储 器 
带宽 为 60 x3bis， 所 以 这 种 电路 的 更 新 速度 非常 慢 。 因 此 ， 之 前 的 设计 过 于 简 
单 。 当 需要 的 存储 器 带宽 比较 大 时 (例如 当 屏 幕 的 很 大 一 部 分 在 很 快 的 刷新 率 下 
更 新 ) ， 存 储 接口 的 设计 就 变 得 相当 困难 。 
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13.6 文献 备注 
詹姆斯 编写 的 《数字 系统 原型 设计 速成 ) 中 描述 了 关于 时 序 信息 监控 。 


13.7 实验 


13.7.1 VGA 测试 图 案 发 生 器 


一 个 VGA 测试 图 案 发 生 器 产生 两 个 简单 的 图 案 用 于 验证 VGA 监视 器 的 操作 
是 否 正确 。 第 一 个 图 案 将 屏幕 平均 分 成 8 个 垂直 的 条 纹 ， 每 个 条 纹 显 示 唯 一 的 颜 
色 。 第 二 个 图 案 与 之 类 似 但 是 将 屏幕 分 成 8 个 水 平 条 纹 。 一 个 1 位 选择 开关 选择 
不 同 图 案 。 

为 图 案 发 生 器 设计 一 个 像素 生成 电路 ， 并 且 和 一 个 同步 电路 在 顶层 相连 。 综 
合并 验证 电路 的 操作 是 否 正确 。 


13.7.2 SVGA 模式 同步 电路 


72Hz 刷新 速率 的 超级 VGA 模式 的 说 明 如 下 : 
e 分 辩 率 : 800 x600 像素 ; 
e 像素 频率 : S0MHz; 
e 水 平 显示 区 域 : 800 像素 ; 
e 水 平 右 侧 边界 : 64 像素 ; 
e 水 平 左 侧 边界 : 56 像素 ; 
e 水 平 折 回 : 120 像素 ; 
e if go. 600 线 ; 
e 垂直 右 侧 边 界 : 64 线 ; 
e 垂直 左 侧 边界 : 56 线 ; 
e 垂直 折 回 : 120 线 。 
我 们 希望 创建 一 个 双 模 式 同 步 电 路 ， 既 能 支持 VGA 模式 也 能 支持 SVGA 模 
模式 选择 通过 开关 实现 。 构 建 电路 的 步骤 如 下 : 
1) 修改 示例 13. 1 中 的 水 平和 垂直 同步 计数 器 以 适应 两 种 模式 。 
2) 设计 一 个 像素 生成 电路 能 够 在 屏幕 上 画 一 个 100 像素 网 格 ( 即 ， 每 100 像 
素 分 别 画 一 条 垂直 和 水 平 线 ) 。 
3) 生成 顶层 模块 。 综 合并 验证 两 个 模式 的 操作 的 正确 性 。 


式 


o 
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13.7.3 ”可视化 屏幕 调整 电路 


由 于 监视 器 内 部 时 序 错误 ， 屏 幕 的 显示 部 分 并 不 总 是 居中 的 。 我 们 可 以 通过 
微调 黑色 区 域 边界 的 宽度 来 调节 显示 部 分 的 位 置 。 在 水 平 扫描 线 中 ， 有 64 个 像 
素 表示 右 侧 和 左 侧 边界 。 为 了 水 平地 移动 显示 部 分 ， 我 们 可 以 在 边界 一 侧 增加 一 
定数 量 的 像素 ， 并 且 在 相反 的 一 侧 减 去 相同 数量 的 像素 。 使 用 同样 的 方法 我 们 可 
以 调节 显示 部 分 进行 垂直 移动 。 设 计 一 个 屏幕 调节 电路 的 步 又 如 下 : 

1) 扩展 VCA 同步 电路 包括 如 下 特征 : 使 用 开关 选择 垂直 或 水 平 模式 ， 并 且 
使 用 两 个 按钮 来 控制 显示 屏幕 的 左 / 上 和 右 / 下 移动 ; 

2) 修改 13. 2. 5 节 中 的 测试 电路 以 包含 新 的 同步 电路 ; 

3) 综合 并 验证 电路 操作 的 正确 性 。 


13.7.4 箱子 里 球 的 电路 


“箱子 里 球 ” 的 电路 显示 了 在 立方 体 箱子 里 的 一 个 活动 球 。 这 个 立方 体 箱子 
在 屏幕 内 居中 ， 其 尺寸 为 256 x256 像素 。 这 个 球 是 一 个 8 x8 像素 大 小 的 圆 球 。 
当 这 个 球 撞击 到 墙壁 ， 这 个 球 反 弹 并 且 墙 闪光 (比如 ， 暂 时 改变 颜色 ) 。 这 个 球 
可 以 以 4 种 不 同 速度 运动 ， 并 且 可 以 通过 两 个 滑动 开关 选择 。 当 一 个 按钮 开关 开 
启 时 ， 球 的 方向 的 改变 是 随机 的 。 产 生源 代码 HDL， 然 后 综合 并 验证 电路 操作 
的 正确 性 。 


13.7.5 箱子 里 两 个 球 的 电路 


我 们 将 13. 7. 4 节 试 验 中 的 电路 扩展 为 包括 箱子 里 包含 两 个 球 。 当 两 个 球 撞 
击 ， 两 个 球 依据 物理 定律 将 会 产生 新 的 方向 。 生 成 源 代 码 HDL， 然 后 综合 并 验 
证 电路 操作 的 正确 性 。 


13.7.6 两 个 游戏 者 的 游戏 


两 个 游戏 者 的 游戏 用 另外 的 短 板 蔡 代 了 左 侧 的 墙 ， 并 且 短 板 由 第 二 名 游戏 者 
控制 。 为 了 能 提供 两 个 游戏 者 ， 我 们 可 以 使 用 9.4 节 中 的 键盘 接口 作为 输入 。4 
个 按键 可 以 控制 两 个 短 板 的 垂直 运动 。 生 成 源 代码 HDL， 然 后 综合 并 验证 电路 
操作 的 正确 性 。 


13.7.7 越狱 游戏 


越狱 游戏 类 似 于 乒乓 游戏 。 在 此 游戏 中 ， 左 侧 的 墙 被 替代 为 多 层 的 砖 。 当 球 
撞击 到 砖 时 ， 球 被 弹 回 并 且 消 失 。 基 本 的 屏幕 如 图 13-11 所 示 。 代 码 如 示例 13. 5 
所 示 ， 我 们 假设 游戏 在 不 断 地 运行 中 。 产 生源 代码 HDL， 然 后 综合 并 验证 电路 
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操作 的 正确 性 。 


球 
n 球拍 


图 13-11 越狱 游戏 的 屏幕 


13.7.8 全 屏 圆 点 轨迹 


我 们 可 以 使 用 外 部 SRAM 芯片 实现 13.5 节 中 的 全 屏 圆 点 轨迹 电路 。 其 步骤 
ШЕ: 

1) 修改 第 11 章 中 SRAM 控制 部 分 ， 配置 SRAM 芯片 为 2”x8 的 存储 器 ; 

2) 根据 13. 5.2 节 的 讨论 ， 在 电路 中 包含 新 的 存储 模块 。 注 意 : 访问 外 部 存 
储 器 需要 两 个 时 钟 周期 ; 

3) 综合 并 验证 电路 操作 的 正确 性 。 


13.7.9 鼠标 指针 电路 


鼠标 接口 在 10. 5 节 中 已 介绍 。 鼠 标 指针 电路 使 用 一 个 鼠标 在 屏幕 中 控制 16 
x16 的 立方 体 的 运动 。 其 操作 如 下 : 

1) 立方 体 依据 鼠标 的 运动 而 运动 ; 

2) рК ян, HERRE; 

3) 当 鼠 标 左 键 按 下 时 指针 改变 颜色 。 改 变 的 颜色 是 在 表 13-1 中 的 8 种 颜色 
中 循环 的 。 

综合 和 验证 电路 操作 的 正确 性 。 


13.7.10 小 屏幕 内 鼠标 轨迹 电路 


鼠标 轨迹 电路 是 要 在 128 x 128 的 屏幕 中 跟踪 鼠标 的 轨迹 ， 和 13. 5 节 中 介绍 
的 圆 点 轨迹 类 似 ， 介 绍 如 下 : 
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e 3 位 开关 决定 轨迹 的 颜色 ; 

e 交替 地 点 击 鼠 标 左 键 表示 鼠标 按 下 和 松 开 ; 
e 单 击 鼠标 右键 清除 屏幕 。 

综合 并 验证 电路 操作 的 正确 性 。 


13.7.11 全 屏幕 鼠标 轨迹 电路 


重复 13.7. 10 节 中 的 试验 , 但 是 使 用 全 屏 。 在 这 个 电路 中 需要 一 个 与 
13. 7. 8 节 中 类 似 的 SRAM 存储 器 。 


4143€ VGA PHAI: 示例 


14.1 简介 


在 第 13.3 节 中 论述 了 一 个 分 布 映 射 像素 生成 方案 。 一 个 点 阵 可 被 认为 是 一 
个 “超级 像素 " 。 尽 管 在 一 个 分 布 映 射 图 案 中 一 个 像素 被 定义 为 3 个 字 节 ， 但 是 
一 个 点 阵 只 能 被 映射 到 一 个 预定 图 案 中 。 以 下 有 一 个 方法 创建 一 个 本 文 显 示 论 述 
点 阵 的 特性 和 利用 分 布 映 射 方案 设计 像素 生成 电路 。 我 们 在 这 一 章节 中 讨论 这 种 
方法 ， 并且 将 它 应 用 到 设计 碰 球 游戏 的 得 分 和 规则 中 去 。 


14.2 举例 


14.2.1 点 阵 的 特性 


当 应 用 一 个 分 布 映射 的 方案 的 时 候 ， 我 们 视 每 个 字符 为 一 块 点 阵 。 在 一 个 按 
位 映射 方案 中 ， 一 个 像素 的 值 表示 一 个 3bit 图 像 。 另 一 方面 ， 一 个 点 阵 的 值 意 
味 着 特定 形式 的 代码 。 为 了 实现 文本 显示 ， 我 们 使 用 7 位 ASCI 码 描述 点 阵 特 
TE. 

点 阵 的 样式 制定 字体 特性 设置 。 这 里 有 多 种 字形 可 供 使 用 。 我 们 选择 一 个 8 
x16 字 型 ， 就 像 在 早期 的 IBM 个 人 计算 机 中 用 的 一 样 。 在 这 一 个 字形 中 , 每 个 
字符 被 一 个 8 x 16 字 型 样式 所 表现 。 如 图 14-1a 中 字母 “A” 模 板 所 示 。 

字符 类 型 被 存储 在 一 个 ROM 中 每 种 类 型 需要 24 x 8bit 空间 。 字 体 ROM 作 
为 一 种 类 型 存储 器 被 我 们 所 熟知 。 最 初 的 字形 组 有 256 种 类 型 ， 包 括 数字 、 大 小 
写字 母 、 标 点 符号 和 许多 特殊 字符 。 我 们 只 实现 一 半 的 样式 而 且 排除 大 多 数 的 特 
殊 符号 。 通 过 计算 ， 至 少 需 要 2 ” x2* x8bitROM 的 空间 。 它 通常 配置 成 一 个 22 
x8 的 ROM, ‘ 

当 我 们 在 一 个 640 x 480 的 固定 屏幕 中 使 用 这 些 8 x 16 字符 的 时 候 ，80 个 点 
阵 被 用 于 匹配 横向 ，30 个 点 阵 被 用 于 匹配 纵向 。 在 其 他 的 字体 中 ， 屏 幕 可 以 被 
处 理 成 一 个 80 x25 的 点 阵 屏 。 我 们 可 以 把 字符 放置 在 这 个 用 缩放 坐标 的 屏幕 
Es 
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2! X8ROM 


字符 地 址 row 


? rAr 


1000001 0000 | 00000000 
1000001 0001 | 00000000 
00010000 
00111000 
01101100 
11000110 
11000110 
11111110 
11000110 
11000110 
11000110 
11000110 
00000000 
00000000 
1000001 1110 | 00000000 
1000001 1111 |00000000 





e 














a) 像素 模式 b) КОМ Ж 
图 14-1 字母 A 的 字 型 模式 


14.2.2 字体 ROM 


我 们 的 字体 工具 能 设置 128 个 ASCH 码 ， 如 表 8-1 所 示 。 这 128 个 字符 类 型 
可 以 由 一 个 2”x8 的 字体 ROM 提供 。 一 个 ROM 中 有 7 个 11bit 地 址 的 MSB 被 用 
来 识别 字符 ， 有 4 个 LSB 的 地 址 被 用 来 识别 一 个 字符 模块 占用 几 排 。 字 母 “A” 
的 地 址 和 ROM 内 容 如 图 14-1b 所 示 。 

在 АЅСП 表 中 ， 第 一 个 栏 由 非 可 印刷 控制 字符 组 成 。 字 体 ROM 使 用 这 些 代 
码 组 实现 特别 的 图 形 符号 。 例 如 ，06,e 码 将 会 在 获 屏 上 产生 一 个 黑 桃 图 案 “ A. 
TER: 为 00i 码 保留 一 块 空白 的 点 阵 。 

2 行 8 排 字 体 ROM 能 很 好 地 应 用 在 Spartan-3 的 单口 block RAM 中 。 我 们 使 
用 示例 12. 6 的 ROM 模板 确保 一 个 block RAM 将 会 在 综合 的 时 候 被 推断 出 来 。 如 
示例 14. 1HDL 码 所 示 。 完 整 的 代码 有 2" 行 ,包含 相应 的 注释 ， 文件 能 从 合作 网 
站 上 下 载 。 

示例 14.1 字体 ROM 的 部 分 代码 


module font_rom 
( 
input wire clk, 
input wire[ 10:0] addr, 
output reg[ 7:0] data 
ji 
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СЕЕ 


reg[ 10:01 addr reg; 


// ЕЖ 


always@ ( posedge clk) 


addr reg <= addr; 


always? ж 


case( addr reg) 
// x00 代码 模块 


11’ h000 : 
11’ h001 ; 
11’ h002 : 
11’ h003 : 
11’ h004 ; 
11’ h005 : 
11’ h006 ; 
11’ h007 : 
11’ h008 : 
11° h009 ; 
11' h00a : 
11’ hOOb ; 
11" h00c : 
11° hO0d ; 
11' h00e ; 
11’ hOOf : 


data = 8' b00000000 ; // 
data = 8 ° b00000000 ;// 
data = 8' b00000000 ; // 
data = 8 ' b00000000 ;// 
data = 8° b00000000 ;// 
data = 8° b00000000 ;// 
data = 8’ b00000000 ;// 
data = 8° b00000000 ;// 
data = 8 ° b00000000 ;// 
data = 8' b00000000 ;// 
data = 8 Ь00000000;// 
data = 8 ' b00000000 ;// 
data = 8 ° b00000000 ;// 
data = 8 ' b00000000 ; // 
data = 8° Ь00000000;// 
data = 8 ' b00000000 ; // 


//x01 RBA AS 


11' h010 : 
11’ h011 
11'h012 ; 
11" h013 ; 
11' h014 ; 
11° h015 ; 
11' h016 ; 
11 h017 : 
11° h018 : 
11° h019 ; 


data = 8 ' b00000000 ;Z/ 


: data = 8' b00000000 ;// 


data = 8’ b01111110;// 
data = 8 b10000001 ;// 
data =8 b10100101 ;// 
data = 8’ b10000001 ;// 
data =8 b10000001 ;// 
data = 8’ b10111101 ;// 
data = 8' b10011001 ;// 
data = 8’ b10000001 ;// 
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11’ h0la ; data =8 7 b10000001 ;// + * 
11’hOlb ; data =8° bO1111110;// * x s ж ж ж 
11’ hOlc ; data = 8' b00000000 ;// 
11' hOld ; data 2 8' b00000000 ;// 
11" hOle ; data 2 8' b00000000 ;// 
11’ hO1f : data = 8' b00000000 ;// 


// x7f 代码 
11 h7f0 ; data 2 8' b00000000 ;// 
11' h7fl : data = 8' b00000000 ;// 
11 h7f2 ; data =8’ b00000000 ;// 
11' h7f3 ; data = 8' b00000000 ;// 
11" h7f4 ; data 2 8' b00010000 ;// * 
11" h7f5 : data =8’ b00111000;// ж жж 
11° 76 : data =8'Ь01101100;// * ж ж * 
11" h7f7 : data =8'b11000110;// * * ж ж 
11 h7f8 ; data=8’b11000110;// ж * ж ж 
11’ h7f9 ; data 28' b11000110;// * 
11" h7fa ; data =8'b11111110;// * ж ож жож ж ж 
11" h7fb : data = 8' b00000000 ;// 
11'h7fc : data =8’ b00000000 ;// 
11' h7fd ; data = 8' b00000000 ;// 
11'h7fe : data = 8' b00000000 ;// 
11’ h7ff ; data = 8' b00000000 ;// 
endcase 


endmodule 


* 
* 
* 


注意 : 以 block RAM 为 基础 的 ROM 执行 输入 需要 一 个 时 钟 周期 的 延 时 ， 如 
第 12.4.3 节 所 讨论 。 


14.2.3 基本 文本 生成 电路 


依照 目前 的 像素 坐标 (pixel. x 和 pixel. y) 、 外 部 的 数据 和 控制 信号 ， 像 素 生 
成 电路 产生 像素 数值 。 像 素 建立 在 一 个 分 布 映 射 的 系统 的 基础 上 ， 包 含 2 个 阶 
段 。 第 一 阶段 使 用 信号 pixel. x 和 pixel. y 的 高 位 生成 点 阵 的 代码 ， 第 二 阶段 使 用 
第 一 阶段 的 代码 和 低位 产生 像素 的 值 。 
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文本 生成 电路 依据 这 个 方法 进行 代码 设计 ， 基 本 图 如 图 14-2 所 示 。 屏 幕 被 
制作 成 一 个 80 * 30 的 点 阵 ， 每 个 点 阵 包含 一 个 8 = 16 的 字体 。 在 第 一 阶段 ， 信 
Ж pixel x [9: 3] 和 Ppixel y [8: 4] 提供 目前 点 阵 位 置 的 x ЖП у 坐标 。 字 符 生 
成 电路 使 用 这 些 坐 标 和 其 他 的 外 部 数据 相 结合 ， 产 生 这 一 块 点 阵 〈 标 注 : char | 
addr) 的 数值 ， 其 数值 符合 一 个 ASC 码 字 符 。 在 第 二 个 阶段 ，ASCI 码 变 成 字 
体 ROM 的 7 个 MSB 地 址 ， 并 详细 说 明了 目前 图 案 的 位 置 。 连 接 荧屏 y 坐标 
(pixel y [3: 0], 标注: row адаг) 的 4 个 LSB 构成 字体 ROM 全 部 的 地 址 〈 标 
Е: rom_addr) 。 在 图 案 中 字体 ROM (标注 : font word) 的 输出 形式 为 一 行 8 
fio "BÉ x 坐标 的 3 个 LSB (pixel x [2: 0], Ж: bit addr) 详细 说 明了 要 求 
的 像素 位 置 和 8 选 1 多 路 图 像 的 输出 。 


4, row_addr 










char addr 


数据 /控制 


rom addr 


bit addr 





图 142 二 级 文本 生成 电路 
14.2.4 字体 显示 电路 


我 们 利用 一 个 简单 的 字体 显示 电路 验证 字体 ROM 的 功能 ， 并 在 荧屏 上 显示 
所 有 的 字体 图 案 。128 个 图 案 分 布 排列 在 4 行 中 ， 图 案 如 表 8-1 中 的 四 列 ASCII 
人 码 表 所 示 。 通 过 使 用 适当 的 x Al у 坐标 产生 想得到 的 ASCII 码 ， 我 们 能 获得 每 个 
图 案 。ASCI 码 由 信和 号 char addr 表示 。 代 人 码 片 段 如 下 : 

assign char. addr = | pixel. y[5;4],pixel x[7:3]|; 
信号 pixel x[7: 3] 形 成 ASCI 码 的 5 个 LSB， 如 此 32(2° ) 个 连续 的 字体 图 案 将 
会 被 显示 成 一 排 。 信 号 pixel y[5: 4] 形 成 ASCII 码 的 2 个 MSB， 如 此 4 个 连续 
的 列 将 会 被 显示 。 因 为 信号 pixel y 和 pixel. x 高 位 溢出 不 明确 ， 所 以 在 荧屏 上 
32 x4 区 域 被 用 来 重复 显示 。 一 个 男 外 的 代码 片段 被 包括 在 内 只 为 荧屏 的 顶端 左 
边 部 分 打开 显示 。 完 整 的 代码 如 示例 14.2 所 示 。 
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示例 14.2 字 型 显示 装置 电路 的 图 素 生 成 代码 


module font test gen 
( 
input wire clk, 
input wire video on, 
input wire [9:0] pixel x,pixel y, 
output reg [2:0 ] rgb text 
好 
// 信号 声明 
wire[ 10:0] гот addr; 
wire[ 6:0] char_addr; 
wire[ 3:0] row_addr; 
wire[ 2:0] bit addr; 
wire[ 7:0 | font мога; 
wire font bit,text bit on; 
// 实体 
// 示例 字体 ROM 
font rom font unit 
(. elk( clk) ,. addr(rom addr),. data(font word) ) ; 
// 字体 ROM 界面 
assign char addr = | pixel y[5:4),pixel х[7:3 ||; 
assign row. addr = pixel. y[3:0]; 
assign rom. addr = | char addr ,row_addr} ; 
assign bit addr = pixel. x[2:0]; 
assign font bit = font. word[ ~ bit_addr] ; 
// “on” fei B dil fe THE KE JH 
Assign text. bit on = (pixel x[9:8] 220 && pixel y[9:6] 2-0) ? font bit : 
1’b0; 
//rgb 多 路 电路 
always? * 
if( — video on) 
rgb text =3 b000; // ZÁ 
else 


if(text bit on) 
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rgb. text 23' b010; // 绿色 
else 
rgb text 23' b000; // #& 
endmodule 


代码 的 主要 部 分 是 字体 ROM 界面 。 为 了 清晰 地 理解 ， 我 们 在 下 面 对 字 体 
ROM 的 信号 给 出 了 相应 的 定义 ， 如 图 14-2 所 示 。 

€ char addr: 7- 位 ， 字 符 的 ASCI $5; 
row_addr: 4 位 ， 在 一 个 详细 的 字体 图 案 中 的 行 数 ; 
rom addr; 11 位 ， 字体 ROM 地 址 ; 由 char_addr 和 row. addr 拼接 ; 
bit_addr: 3 位 ， 在 一 个 详细 的 字体 图 案 中 的 列 数 ; 
font word; 8 位 ， 由 rom_addr 指定 的 一 个 图 素 的 行 字体 图 案 ; 
font bit; 1 位 ， 被 bit_addr 指定 的 font word 的 一 个 像素 。 

这 些 信号 根据 图 14-2 所 示 的 框图 进行 连接 。font_bit 信号 的 流程 由 多 路 选择 
器 完成 ， 其 代码 如 下 : 

assign font. bit = font_word[ ~ bit_addr] ; 
注意 : 在 字体 ROM 中 一 行 ( 也 就 是 一 个 字 ) 根据 递减 的 顺序 被 定义 (也 就 是 
[7: 0])。 因 为 严 屏 的 x 坐标 于 上 升 的 方式 被 定义 ， 数 目 从 左边 到 右边 增加 ， 重 
新 获得 位 的 顺序 必须 取 反 。 在 语句 中 由 “ ~ ”运算 符 完成 。 

我 们 需要 结合 同步 电路 和 创建 顶层 描述 。 其 HDL 代码 如 示例 14. 3 所 示 。 

示例 14.3 字体 显示 电路 顶层 描述 


module font test top 

( 
input wire clk, reset, 
output wire hsync, vsync, 
output wire [2: 0] rgb 
J; 
// fei ЭРҮ] 
wire [9; 0] pixel_x, pixel_y; 
wire video_on, pixel_tick; 
reg [2: 0] rgb_reg; 
wire [2: 0] rgb next; 
// 实体 
// WP: VGA 同步 电路 
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vga _вупс vsync unit 
(. clk (clk),. reset (reset),. hsync (hsync),. vsync (vsync),. video on 
(video on),. p tick (pixel tick),. pixel x (pixel x),. pixel y (pixel y)); 
// ЧЖЕН 
font test gen font gen unit 
(. elk (clk),. video on (video on),. pixel x (pixel x),. pixel y (pixel 
у), rgb text (тер next)) ; 
// rgb Zh 
always? ( posedge clk) 
if (pixel tick) 
rgb reg <=rgb next; 
// 输出 
Assign rgb = rgb reg; 
endmodule 


在 这 个 电路 里 存在 微妙 的 时 序 问题 。 因 为 block RAM 执行 字体 ROM 输出 时 
将 经 历 一 个 时 钟 周期 的 延 时 。 然 而 ， 因 为 信号 pixel tick 每 两 个 时 钟 周期 会 被 判 
断 一 次 ， 所 以 在 信号 pixel x 的 数据 未 改变 的 时 间 间 隔 内 ， 通 信 的 数据 (font _ 
bit) 会 完全 地 被 重新 得 到 。 多 路 rgb 电路 可 以 使 用 这 些 数 据 ， 并 且 采 取 及 时 的 方 
式 把 期 望 值 存储 在 寄存 器 rgb reg 中 。 


14.2.5 字体 缩放 比例 


在 分 布 映 射 的 系统 中 ， 我 们 能 依据 一 个 点 阵 图 案 的 比例 通过 “扩大 ”荧屏 
图 素 扩大 尺寸 。 例 如 ， 我 们 可 以 依据 比例 把 8 = 16 字体 扩大 像素 4 次 到 16 * 32 
字体 (也 就 是 说 ，1 像素 扩大 到 4 像素 ) 。 为 了 执行 缩放 比例 ,我 们 仅仅 需要 把 
图 素 坐 标 向 右 移动 1 个 位 ， 而 且 丢 弃 信 号 pixel. x 和 pixel. y 的 LSB。 有 一 个 例子 
能 很 好 地 解释 。 让 我 们 在 先前 字体 的 地 方 重复 显示 扩大 后 的 16 + 32 FR, RGF 
现在 能 被 当做 一 个 40 * 15 点 阵 。 新 的 字体 地 址 会 变 成 如 下 : 

assign row_addr=Ppixel y[4:1]; 

assign bit addr = pixel x[3:1]; 

assign char. addr = | pixel. y[6:5] ,pixel x[8:4]] ; 
首先 这 两 个 声明 意味 着 当 pixel x [0] Ail pixel_y [0] Jy "00", “01”, “10” 
和 “11” 的 时 候 ， 相 同 的 font_bit 值 将 被 获得 ， 通 过 这 个 原始 像素 会 有 效 地 被 扩 
大 到 4 倍 像素 。text_bit_on 条 件 也 需要 被 修改 来 适应 一 个 更 大 的 区 域 : 

Assign text. bit on = (pixel x[9] 220 && pixel_y[9:7] ==0)? Font bit ; 1’ 
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b0; 

我 们 能 应 用 这 个 系统 在 字体 上 更 进一步 地 扩展 比例 范围 。 注 意 : 因为 它们 只 是 简 
单 地 放大 最 初 的 图 案 ， 而 且 没 有 引进 更 新 的 细节 ， 所 以 被 扩大 的 字体 可 能 显现 出 
锯齿 形状 。 


14.3 全 屏 文 本 显示 


正如 其 名 称 所 说 ， 全 屏 文本 显示 使 用 整个 荧屏 显示 文本 字符 。 现 在 字符 生成 
电路 包含 了 一 个 点 阵 存储 器 ， 它 能 存储 每 个 点 阵 的 ASCH 码 。 点 阵 存储 器 的 设计 
与 第 13.5 节 的 位 映射 电路 的 视频 存储 器 类 似 。 为 了 使 存储 器 容易 存 取 ， 我 们 可 
以 通过 连接 一 个 点 阵 的 x ЯП у 坐标 形成 地 址 。 这 将 转化 为 12bit 的 80 * 30 (也 就 
是 27 *25) 点 阵 获 屏 。 因 为 每 个 点 阵 包 含 一 个 7 位 ASCI 码 ， 所 以 它 需 要 一 个 
2" «7 的 存储 模块 。 一 个 同步 双 端 口 RAM 能 实现 该 目的 。 点 阵 存 储 电路 如 图 14- 
3 所 示 。 
pixel_y[3:0] 


Ipixel y[8:4], 
pixel x[9:3]) 


row addr 








btn[2] 


SW 








btn[1] 
btn[0] 








delayed pixel_x[2:0] t 
PS 3 bit addr 


图 14-3 含 点 阵 存储 器 的 文本 生成 电路 


因为 访问 点 阵 存储 器 需要 另外 的 一 个 时 钟 周期 ， 但 是 现在 取 回 一 个 字体 图 案 
的 时 间 增 加 到 2 个 时 钟 周期 。 延 长 延 时 引起 了 一 个 敏感 时 序 问题 。 因 为 信号 pix- 
el x 的 更 新 需要 两 个 时 钟 周期 ， 所 以 当 font word 变 成 有 效 时 它 的 值 会 增加 。 因 
而 ， 当 数据 通过 声明 被 重新 使 用 的 时 候 ，bit адаг 的 增 量 被 使 用 ， 而 且 一 个 不 正 
确 的 字体 数据 将 会 被 选择 和 发 送 输出 。 通 过 把 信号 pixel x 穿 过 两 个 buffer 的 方 
式 来 解决 这 个 时 序 问题 ， 用 这 个 延 时 信号 来 代替 pixel. x 信和 号。 

assign bit addr = pix x2 reg[2:0]; 

assign font. bit = font word[ ~ bit addr]; 


我 们 使 用 一 个 简单 的 电路 证 明 全 荧屏 分 布 映 射 系 统 的 设计 。 电 路 从 一 个 7 位 
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开关 器 读 取 ASCII 码 ， 放 置 在 80 * 30 点 阵 荧 屏 上 的 显著 位 置 。 概 要 图 如 图 14-3 
所 示 。 光 标 进 入 到 当前 的 位 置 时 ， 其 颜色 会 翻转 。 光 标 块 保持 光标 当前 位 置 的 路 
径 。 电 路 使 用 3 个 按钮 开关 作为 控制 。 其 中 两 个 按钮 分 别 控制 光标 向 右 和 向 下 移 
动 。 第 三 个 按钮 控制 写 操作 。 当 按钮 被 按 下 的 时 候 , 7 位 开关 的 当前 数值 被 写 到 
点 阵 存储 器 中 。HDL 代码 如 示例 14. 4 所 示 。 

示例 14.4 ”全屏 文本 显示 生成 电路 


module text screen. gen 
( 
input wire clk , reset , 
input wire video on, 
input wire[ 2 :0 ] btn, 
input wire[ 6:0] sw, 
input wire[9:0] pixel x,pixel y, 
output reg[ 2 :0] text rgb 
i 
// 信号 声明 
// 字体 ROM 
wire[ 10:0] rom addr; 
wire[ 6:0] char. addr; 
wire[ 3:0] том addr; 
wire[ 2:0] bit. addr; 
wire[ 7:0] font word; 
wire font. bit; 
// ERAM 
wire we; 
wire[ 11 :0 Jaddr r,addr w; 
wire[ 6:0] din,dout; 
//80 «30 Hh E] 
localparam MAX X =80; 
localparam MAX Y =30; 
// 光标 
reg[ 6:0] cur x reg; 
wire[ 6:0] cur x next; 


reg[4:0] cur y reg; 
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wire[4:0] cur y next ; 
wire move x tick, move y tick, cursor on ; 
// RAUL HEMT 
reg[ 9:0] pix xl reg,pix yl reg; 
reg[ 9:0] pix x2 reg,pix y2 reg; 
// 输出 信号 
Wire[2 :0] font rgb,font rev rgb ; 
// 实体 
//2 AREAS Bc pá HB pk SE BA 
debounce deb unitÜ 
(. elk( elk) ,. reset( reset) ,. sw( btn[0]) ,. db level() ,. db tick(move x tick) ) ; 
debounce deb unitl 
(. elk( elk) ,. reset( reset) ,. sw( btn[ 1]) ,. db level(),. db tick(move y tick) ) ; 
// BLE fk ROM 
font rom font. unit 
(. clk( elk) ,. addr(rom addr),. data(font word)) ; 
// 例 化 双 口 视频 RAM (2° *7 ) 
Xilinx_dual port ram sync 
#(. ADDR. WIDTH(12) ,. DATA WIDTH(7)) video ram 
C elk( elk) ,. we( we) ,. addr a(addr w),.addr b(addr r),.din a(),.dout b 
(dout) ) ; 

// BAF GH 
always@ ( posedge clk ) 

begin 

cur x reg <=cur x next; 
cur y reg <= сиг y next; 

pix xl reg <= pixel x; 

pix x2 reg <= pix xl тер; 

pix yl reg <= pixel у; 

pix y2 reg <= pix yl reg ; 

end 

// 写 点 阵 R4M 

assign addr w= | сиг y reg,cur x тер}; 

assign we = btn[2] ; 


assign din 2 sw; 
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// GEK ВЕКАМ 

// ВЕНАРА E CHE ILI RAM 地 址 

assign addr_r = | pixel y[8:4],pixel x[9:3]] ; 

assign char addr = dout; 

// 字体 ROM 

assign row_addr = pixel. y[3:0]; 

assign rom. addr = | char адаг, гоу addr|; 

// EHER E GFE TM 

assign bit addr = pix x2 reg[2:0]; 

assign font bit = font. word[ ~ bit addr] ; 

// 新 光标 位 置 

assign cur x next = (move x tick && (cur x reg==MAX X-1))?0:// 包 
(move x tick)? cur x reg +1 : cur x reg; 

Assign cur y next = (move y tick && (cur x reg == MAX Y -1))? 0:7/ fg 
(move y tick)? cur y reg +1 : cur y reg; 

// 对 象 信号 

// 实现 光标 在 黑色 和 绿色 视频 接口 的 逆向 转换 

assign font_rgb = (font bit) ? 3' b000 : 3' b000 ; 

assign font rev тер = (font bit) ? 3' b000 : 3' b010O ; 

// Jy ГХН EB TE 6 

assign cursor on = (pix y2 reg[8 ;4] == сиг y reg) && 

(pix x2 reg[9 :3] == сиг x тев); 

//rgb & HII ot 

always @ x 

if( ~ video on) 

tect_rgb 23' b000; // ZA 

else 

if( cursor on) 

text тер = font rev rgb; 

else 

text. rgb = font rgb ; 


endmodule 
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字体 ROM 的 界面 信号 类 似 于 示例 14. 2 中 的 信和 号， 除去 char addr 从 点 阵 存 
储 器 读 取 端 口 获 得 的 信号 。 为 了 使 当前 x ЯП у 坐标 pixel x 和 pixel y 能 有 效 地 存 
储 在 字体 ROM 中 ， 我 们 创建 了 两 个 延 时 信号 pix x2 reg 和 pix y2 тев. TER: 
非 延 时 信号 pixel x 和 pixel. y 用 来 当做 地 址 连接 到 字体 ROM 上 ， 延 时 信号 pix _ 
x2 reg 用 来 获取 字体 数据 。 双 端口 点 阵 RAM 示例 和 界面 与 示例 13.7 中 的 视频 
RAM 相似 。 

信号 cursor on 被 用 来 识别 指针 当前 的 位 置 。 指 针 所 在 位 置 的 字体 图 案 的 颜 
色 被 翻转 。 因 为 字体 数据 的 两 个 时 钟 延 时 ， 所 以 我 们 使 用 延 时 坐标 信号 pix x2 _ 
reg 和 pix_y2_reg 相 比 较 。 

字体 数据 延 时 也 为 最 终 的 信号 rgb 引入 一 个 像素 延 时 。 这 意味 着 一 部 分 完全 
可 见 的 VGA 监视 器 向 右 移动 了 一 个 像素 。 为 了 解决 这 个 问题 ， 我 们 应 修改 ува _ 
sync 电路 和 使 用 延 时 信号 pix x2 reg 和 pix y2 reg 产生 信号 hsyne (水 平 同步 ) 
和 vsyne (垂直 同步 ) 。 当 移动 对 全 部 视频 效果 影响 不 大 时 ， 我 们 就 不 做 相应 的 
修改 。 

顶层 代码 例 化 了 文本 像素 生成 电路 和 同步 电路 ， 如 示例 14. 5 所 示 。 

示例 14.5 全 屏 文本 显示 顶层 设计 


module text screen top 
( 
input wire clk, reset, 
input wire[ 2 :0 ] btn, 
input wire[ 6:0 ]sw, 
output wire hsync, vsync, 
output wire[ 2:0 ] rgb 
H 
// {Н FIBI 
wire[ 9:01 pixel x,pixel y; 
wire video on,pixel tick; 
reg[ 2:0 ]rgb reg; 
wire[ 2:0] rgb next; 
// 实体 
// vga 同步 下 路 实例 
vga sync vsync unit 
(. elk( clk) ,. reset( reset) ,. hsync( hsync) ,. vsync( vsync) ,. video on(video on), 
.p tick(pixel tick) ,. pixel x(pixel _x) ,. pixel y(pixel y)); 


- 396 - 用 Verilog 设计 FPGA 样机 实例 解析 (Xilinx Spartan-3 版 ) 








/人 /字体 生成 电路 
text screen gen text gen unit 
(. elk( clk) ,. reset( reset) ,. video on(video on),. btn( btn) ,. sw( sw), 
. pixel. x(pixel x),. pixel y(pixel у) ,. text_rgb(rgb_next) ) ; 
// RGB rpg 
always@ ( posedge clk ) 
if( pixel. tick) 
rgb reg <= rgb next ; 
// 输出 
assign rgb = rgb reg; 
endmodule 


14.4 ”完整 的 乒乓 游戏 设计 


在 13.4.3 节 我 们 为 乒乓 游戏 设计 创建 了 自由 运行 的 图 形 电路 。 在 本 节 中 ， 
我 们 增加 一 个 文本 界面 用 于 显示 得 分 和 信息 ， 设 计 了 一 个 整合 了 图 形 和 文本 子 系 
统 的 顶层 控制 状态 机 来 配置 整个 电路 系统 的 运行 。 完 整 的 乒乓 游戏 的 规则 和 操作 
流程 如 下 : 

e 当 游 戏 开 始 的 时 候 ， 显 示 文 本 规则 ; 

e 接 下 来 玩家 按 下 按钮 ， 游 戏 开 始 ; 

e 玩家 记 下 每 次 用 球拍 击 球 的 分 数 ; 

e 当 玩 家 丢 球 的 时 候 ， 游 戏 中 止 ， 重 新 发 球 ， 每 个 玩家 拥有 3 个 球 ; 

e 得 分 和 剩余 的 球 数 在 屏幕 上 方 显示 ; 

e 当 玩 家 丢掉 3 个 球 之 后 ， 游 戏 结束 ， 显 示 游戏 结束 信息 。 

在 下 面 的 部 分 ， 我 们 首先 讨论 了 文本 子 系统 、 图 解 子 系统 和 辅助 计数 器 ， 然 
后 从 顶层 状态 机 到 坐标 和 全 部 操作 控制 。 概 要 图 如 图 14-4 所 示 。 


14.4.1 文本 子 系统 


乒乓 游戏 的 子 系统 由 4 个 文本 信息 组 成 

e 在 荧屏 上 面 用 16 * 32 字体 ， 使 用 “Scores: DD" ЖП “Ball: D” 方 式 分 
别 显示 得 分 和 剩余 球 数 ; 

e 在 游戏 开始 的 时 候 ， 使 用 常用 的 字体 显示 规则 信息 “Rules: Use two but- 
tons to move paddle up or down" ; 


e bi “PONG” T 64 * 128 的 字体 在 背景 上 显示 ; 


814% УСА Frag H : 示例 + 397. 


















pixel x hit 
pixel y miss 





vga sync 









bt btn 
" [| graph still 
graph rgb 


graph on 







pong graph 





btn 
graph still 
hit State reg 














图 144 完整 的 乒乓 游戏 设计 顶层 模块 图 


e 在 游戏 结束 后 ， 于 32 * 64 的 字体 显示 游戏 结束 提示 信息 “Game Over", 
初始 三 条 概要 信息 如 图 14-5 Score: 00 Ball: 3 
所 示 。 游 戏 结束 后 的 信息 在 规则 


信息 和 不 包括 在 内 的 信息 之 间 相 Rule: 
互 交替 变换 。 人 

由 于 那些 信息 使 用 不 同 的 字 Wo ° | 
体 尺寸 在 不 同 的 场合 显示 ， 所 以 PONG 
我 们 不 能 在 一 个 单独 场景 中 创建 


那些 信息 。 我 们 视 每 个 文本 信息 
都 是 一 个 单独 对 象 并 产生 状况 信 
号 和 字体 ROM 地 址 。 例 如 ， 信 息 图 14-5 乒乓 游戏 文本 
标识 语 片 段 如 下 : 

assign logo on = ( pix_y[9:7] 222) &&(3 <=pix x[9:6]) &&(pix x[9:6] 
<=6); 

assign row addr 1 = pix y[6:3]; 
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assign bit addr 1 = pix x[5:3]; 
always (9 * 
case (pix x[8:6]) 
3'03; char addr 1 -7'h50; //P 
3’ 04: char addr 1 =7’ h4f; //O 
3'05; char addr 1 =7'h4e; //N 
default; char addr 1 27' h47; //G 
endcase 
信号 logo on 指出 在 标识 语 区 域 当前 浏览 的 相应 文本 是 “turned on”。 其 他 
声明 详细 说 明了 信息 内 容 和 字体 ROM 连接 生成 32 x 64 的 鳞 形 字符 。 其 他 三 部 分 
类 似 。 单 独 的 多 路 电路 检查 不 同 的 信号 和 对 字体 ROM 的 地 址 的 设置 路 径 。 
文本 子 系统 通过 接口 ball, dig0 和 digl 接收 得 分 和 剩余 球 的 数量 。 通 过 接口 
rgb text 输出 rgb 信息 ， 通 过 4 位 接口 text on 连接 4 个 单独 的 信号 输出 状态 信 
息 。 完 整 的 代码 如 示例 14. 6 所 示 。 
示例 14.6 乒乓 游戏 的 文本 子 系统 


module pong text 

( 

input wire clk, 

input wire[ 1:0] ball, 

input wire[ 3:0] digO, digl, 

input wire[9:0] pix x, pix y, 

output wire[ 3:0] text on, 

output reg[ 2:0] text rgb 

); 

// 信号 声明 

wire[ 10:0] rom. addr; 

reg[6:0] char addr , char addr s , char addr 1 ,char addr г, char addr o; 
reg[ 3:0] row адаг; 

wire[ 3:0] row addr s , row addr 1 , row addr г, row addr o; 
reg[ 2:0] bit addr; 

wire[2:0] bit addr s, bit addr l,bit addr r, bit addr o; 
wire[7:0] font word; 





wire font bit , score on, logo on, rule on, over on; 


wire[ 7:0] rule rom addr; 
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// 例 化 字体 ROM 


font rom font unit 


(. elk( сік) ,. addr(rom_addr). . data( font word) ) ; 


// 得 分 区 

// -在 左上 角 显 示 两 位 数 的 得 分 和 翻 余 球 数 
// -使 用 16 «32 FI 

// -第 一 行 ,16 个 字符 ;”"Score :DD Ball :D" 


assign score on = (pix y[9:5] ==0) && (pix x[9:4] <16) ; 
assign row addr s- pix y[4:1]; 

assign bit addr s = pix x[3:1]; 

always @ * 

case(pix x[7:4]) 

4' h0: char addr s -7'h53; //S 

4'hl: char addr s -7' h63; //c 

4'h2; char addr s-7'h6f; //o 

4' h3; char addr s-7'h72; //r 

4'h4; char addr s =7jh65; //e 

4'h5: char addr s 27'h3a; // : 

4'h6: char addr s = |3' b011, фрі! ; // 十 位 数字 
4'h7: char addr s = |3' b011, digO} ; // 个 位 数字 
4'h8: char addr s -7'h00; // 

4' h9; char addr s -7'h00; // 

4'ha; char addr s =7’ h42; //B 

4'hb: char addr 5 =7°һ61; //a 

4'he; char addr s-27' h6c; //1 

4' hd: char адаг s -7'h6c; //1 

4'he: char addr s-7'h3a; // : 

4' hf; char addr s = |5' b01100, ball} ; 


Епасаѕе 


// 标识 语 区 : 
// -在 顶部 中 间 显 示 标 识 请 ' PONG" 
// -作为 背景 使 用 
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// -使 用 64 *128 字体 


assign logo on = (pix y[9:7] ==2) &&(3 <=pix_x[9: 6] ) && (pi x[9:6] <= 
6) ; 

assign row addr 1 = pix y[6:3]; 

assign bit addr 1 = pix x[5:3]; 

always @ * 

case( pix x[8:6]) 

3'03; char addr 1 27'h50; //P 

3'04: char addr 1 -7'h4f; //0 

3'05: char addr 1 =7’ h4e; //N 

default ;char addr 1 27'h47; //G 


Endcase 


// 规则 区 

// -在 中 央 显 示 规 则 (4 *16 字体 ) 
// -规则 文本 : 

//Rule ; 

// use two buttons 

//to move paddle 

// up and down 


assign rule on = (pix x[9: 7] 222) && (pix y[9:6] 2-2); 

assign row addr г = pix y[3: 0]; 

assign bit addr г = pix x[2: 0]; 

assign rule rom addr = | pix. y[5:4] ,pix_x[6:3]); 

always @ * 

case(rule rom addr) 

// ЖІ + 
6'h00: char addr r2 7' h52; //R 
6'h0l; char addr r-7'h55; //U 
6' h02; char addr r-7'h4c; //L 
6’ h03; char addr r-7'h45; //E 
6’ h04: char addr r-7'h3a; // : 
6' h05: char addr r-7' h00; // 
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6’ h06; char addr r=7’ h00; // 
6’ h07; char addr r=7’ h00; // 
6’ h08; char addr r -7' h00; // 
6' h09: char addr г -7jh00; // 
6'h0a: char addr r 2 7' h00; // 
6'hOb: char addr r -7' h00; // 
6'h0c: char addr г=7 h00; // 
6'h0d: char addr r =7° h00; // 
6'h0e; char addr г=7 h00; // 
6' hOf; char. addr г 27' h00; // 
// 第 2 fil 

6'hl0; char addr r=7’h55; //U 
6'hll; char addr r=7’h73; //s 
6'hl2; char addr r -7'h65; //e 
6' h13; char addr r 2 7' h00; // 
6'hl4: char addr r 27' h74; //t 
6'hl5: char addr r2 7' h77; / /w 
6'hl6; char addr r -7' h6f ; //o 
6’h17; char addr r 2 7' h00; // 
6'hl18; char addr г=7' h62; //b 
6'hl19; char addr r-7'h75; //u 
6’ hla: char addr r 2 7' h74; //t 
6'hlb: char addr r-27'h74; //t 
6'hlc; char addr r=7 h6f ; //o 
6'hld: char addr r=7’h6e; //n 
6'hle; char addr r 2 7' h73; //s 
6'hlf: char addr r -7' h00; // 
// 第 3 HE 

6'h20; char addr г =7’ h74; /At 
6'h21: char addr r=7’ h6f; //o 
6' h22; char addr r=7 h00; // 
6' h23; char addr r=7’ h6d; //m 
6' h24; char addr r -7' h6f ; //o 
6'h25: char addr r -7' h76; //v 
6' h26: char addr r -7' h65; //e 
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6’ h27; char addr r -7' h00; // 
6' h28; char. addr r 27' h70; //p 
6' h29: char addr r -7' h61; //a 
6'h2a: char addr r -7' h64; //d 
6'h2b: char addr r-7'h64; //d 
6'h2c; char addr r=7’ h6c; /AT 
6’ h2d: char addr r -7' h65; //e 
6' h2e : char. addr r -7' h00; // 
6'h2f; char addr r -7'h00; // 
// 984 НЕ 

6' h30; char addr r=7'h75; //u 
6' h31; char addr rz 7'h70; //p 
6' h32; char addr г=7' h00; // 
6' h33; char addr r=7’ h61; //a 
6' h34: char addr r-7'h6e; //n 
6' h35; char addr r=7’h64; //d 
6' h36: char addr г=7' h00; // 
6' h37; char addr r =7’ h64; //d 
6' h38; char_addr_r=7’ h6f ; //o 
6' h39. char addr r-27' h77; //w 
6'h3a; char addr r =7jh6e; //n 
6'h3b; char addr r-7' h2e; // 
6’h3c: char. addr r=7 h00; // 
6' h3d; char addr r -7' h00; // 
6' h3e; char addr r-7'h00; // 
6' h3f; char addr г=7' h00; // 


endcase 


// 游戏 结束 区 
// -在 中 央 显 示 " Game Over" 
// -使 用 32 «64 字体 


assign over on = (pix y[9: 6] 223) &&(5 <=pix x[9: 5] ) &&(pix x 
[9: 5] <=13); 
assign row_addr_o=pix_y[5; 2] ; 
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assign bit_addr_o = pix_x[4:2] ; 
always @ * 
case (pix x[a: 5] ) 

4'h5: char addr o =7’h47; //G 
4'h6; char addr o -7' h61; //a 
4'h7; char addr o =7’ h6d; //m 
4'h8; char addr o -7' h65; //e 
4' h9: char addr o -7' h00; // 
4'ha; char addr o =7’ h4f; //0 
4'hb: char addr o =7' 76; //v 
4'he; char addr o =7 h65; //e 
default : char. адаг o =7’h72; /Ar 


endcase 


begin 
text. rgb 23' b110; // 背景 ,黄色 
if(score on) 
begin 
char адаг = char addr s; 
row addr = row _addr s; 
bit addr = bit addr s; 
if (font. bit) 
text. rgb =3’ b001; 
end 
elseif( rule on) 
begin 
char адаг = char addr г; 
row _addr = row addr г; 
bit addr- bit addr г; 
if (font. bit) 
text. rgb = 3jb001 ; 


end 
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elseif (logo on) 
begin 
char адаг = char addr 1; 
row addr-row addr 1; 
bit адаг = bit адаг 1; 
if (font bit) 
text. тер 23' b011; 
end 
else // 游戏 结识 
begin 
char addr = char addr о; 
row addr = row addr o; 
bit addr = bit адаг o; 
if (font. bit) 
text. rgb =3’ b001; 
end 
end 


assign text on = (score on, logo on, rule on, over on| ; 


// 字体 ROM 接口 

assign гот addr = (char addr, row addr|; 

assign font. bit = font word[ ~ bit addr] ; 
endmodule 


每 部 分 的 结构 都 是 类 似 的 。 因 为 信息 短 ， 所 以 使 用 ROM 模板 规范 对 它们 进 


行 编码 。 此 外 没有 使 用 时 钟 信号 ， 推 断 应 该 是 分 布 式 RAM 或 组 合 逻 辑 。 根 据 2 
个 Abit 的 外 部 信号 dig0 和 digl 产生 2 个 数字 存储 器 。 注 意 数字 0，1，…，9 的 
ASCII 编码 是 3016，3116，…，3916。 我 们 能 简单 地 通过 在 dig0 和 digl 前 连接 
“011” 产生 char-addr 信和 号。 


14.4.2 修正 图 像 分 系统 


为 了 适应 新 的 顶层 控制 器 ，13. 4. 3 节 电 路 图 要 求 做 以 下 更 改 : 
e 增 加 一 个 gra-still 控制 信号 (为 “still graphics") ， 当 该 信号 被 声明 后 ， 不 


用 移动 ， 垂 直线 被 放置 在 中 间 ， 球 被 放置 在 屏幕 中 心 ; 


e 增 加 hit. miss 状态 信号 ， 当 球拍 击 中 球 的 时 候 ，hit 信和 号 会 被 置 一 个 时 钟 
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周期 有 效 ， 当 球拍 没有 击 中 球 并 且 越 过 右边 边界 的 时 候 ， 置 miss 信号 有 效 ; 
e 增 加 一 个 graph-on 信号 用 于 显示 图 像 分 系统 的 状态 。 
代码 的 更 改 部 分 在 示例 14.7 中 显示 。 
示例 14.7 乒乓 游戏 图 像 分 系统 的 更 改 部 分 


// 新 的 球 位 置 
assign ball x next = (gra still) ? MAX X/2. 
(refr tick) ? ball x reg *x delta reg : 
ball x reg ; 
assign ball y next = (gra stil) ? МАХ Ү/2 ; 
(refr tick) ? ball y reg-*y delta reg : 
ball y reg ; 
// 新 的 球速 度 
always @ * 
begin 
hit=1' b0; 
miss = 1’ b0; 
x delta next = х _delta reg; 
y delta next = y delta reg; 
if (gra still) // ДД 
begin 
x delta nex = ВАШ, V №; 
y delta next = BALL. V P; 
end 
elseif (ball y t«1) /到 让 顶部 
y delta next = BALL. V P; 
elseif (ball y b» (MAX Y 1)) // 到 达 底 部 
y delta next = BALL. V N; 
elseif (ball x 1 <= WALL X К) // 到 达 墙 
x delta next = BALL. У P; // 74 |a] 
elseif ((BAR X L«-ball x г) && (ball x г<= BAR X К) && 
(bar y t «2ball y b) && (ball у t<=bar y b)) 
begin 
// Sls TrViJf H fitit; , pk pa In] 
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x_delta_next=BALL V N; 
hit 21" bl; 

end 

elseif (ball x г> MAX X) // Sli fr ^ 
is miss =1 bl; ЖЕФ 


end 


assign graph. on = wall on | bar on | rd ball on; 


14.4.3 辅助 计数 器 


为 了 方便 计算 ,顶层 设计 要 求 有 两 个 有 用 的 小 模块 ，m100-counter 和 timer, 
m100 counter 模块 是 一 个 两 位 的 十 进 制 计 数 器 ， 计 数 范围 从 00 ~99， 用 于 记录 
比赛 的 得 分 。d_ine 和 d сіг 控制 信号 分 别 用 于 增加 和 清除 该 计数 器 。 示 例 14. 8 
显示 了 该 部 分 代码 。 

示例 14.8 ”两 位 十 进 制 计 数 器 


module m100 counter 
( 
input wire clk, reset, 
input wire d inc, d clr, 
output wire[ 3:0] dig0 digl 
); 
// 信号 声明 
reg[ 3: 0] dig0 reg, dig] reg, 020 next, digl next; 
// BAF Ge 
always @ (posedge clk , posedge reset ) 
if ( reset) 
begin 
digl reg <=0; 
dig) reg <=0; 
end 
else 


begin 
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digl reg <= digl next ; 
dig0 reg <= dig0 next ; 
end 
// Ке 
always @ +* 
begin 
dig) next = digÜ тер; 
digl next = digl reg; 
if (d elr) 
begin 
dig) next =0 ; 
digl next 20 ; 
end 
elseif (d inc) 
if (4р0 reg 229) 
begin 
dig0 next 20; 
if (digl reg 229) 
digl next 20; 
else 
digl next = digl reg +1; 
end 
else //dig0 ,不 是 9 
dig0_next =dig0 reg +1; 
end 
// bi 
assign dig) = digÜ reg; 
assign dig] = digl reg; 


endmodule 





Timer 模块 使 用 60Hz 周期 脉冲 timer-tick 来 产生 一 段 2s ir [B] fal. "RH 
的 是 使 视频 在 屏幕 切换 时 暂停 。 当 timer-start 信号 被 声明 ， 并 且 当 2s 的 时 间 间 隔 
到 了 ，timer-up 信号 有 效 时 ， 该 计数 器 开始 计数 。 代 码 如 示例 14. 9 所 示 。 
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示例 14.9 2s 计数 器 


module timer 
( 
input wire clk, reset, 
input wire timer start , timer tick, 
output wire timer up 
)s 
// 信号 声明 
Reg[6:0] timer reg, timer next; 
// FEAE 
always @ (posedge clk, posedge reset) 
if ( reset) 
timer reg <=7 blllllll; 
else 
timer reg <= timer next ; 
// iE TR 
always @ * 
if (timer. start) 
timer next — 7 ЫШ; 
elseif ( (timer tick) && (timer reg | =0)) 
timer next = timer-reg - 1; 
else 
timer next = timer reg; 
// 输出 
assign timer up = (timer reg 2-0); 


endmodule 


14.4.4 ”顶层 系统 


乒乓 游戏 的 顶层 系统 由 先前 的 设计 模块 组 成 ,包括 视频 同步 电路 、 图 像 分 系 
统 、 文 本 分 系统 和 有 效 的 计数 器 ， 以 及 有 限 状态 机 控制 电路 和 rgb 复 用 电路 。 其 
结构 框图 如 图 14-4 所 示 。 

状态 机 控制 和 监控 整个 系统 的 操作 及 文本 和 图 像 子 系统 的 相关 动作 。 其 
ASMD 图 如 图 14-6 所 示 。 状 态 机 有 下 列 4 个 状态 和 相关 操作 : 
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Pa 14-6 乒乓 控制 器 ASMD 
e 最 初 状态 机 是 在 newgame 状态 ， 当 按 下 一 个 按钮 时 游戏 开始 ， 同 时 状态 


机 跳 到 play 状态 ; 
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e 在 play 状态 ， 状 态 机 连续 检验 hit 和 miss 信号 ， 当 hit 信号 有 效 时 ， 为 了 
在 一 个 时 钟 周期 使 得 分 计数 器 加 一 ，d inc 信号 被 声明 ， 当 miss 信号 被 声明 时 ， 
FSM 激活 25 计数 器 ，ball 数量 减 一 ， 同 时 检测 剩 下 的 球 的 数量 ， 如 果 球 数 为 零 ， 
游戏 结束 ， 同 时 状态 机 跳 到 over 状态 。 和 否则 状态 机 跳 到 newball 状态 ; 
ө 在 newball 状态 时 ， 状 态 机 等 到 2s 计数 间隔 计 满 (如 这 时 timer-up 信号 被 
申明 ) ， 同 时 一 个 按钮 被 按 下 ， 接 下 来 跳 到 play 状态 继续 游戏 ; 
ө 状态 机 保持 在 over 状态 直到 2s 计数 间隔 计 满 ， 然 后 跳 到 newgame 状态 开 
始 新 的 游戏 。 
rgb 复 用 电路 依据 text-on 和 graphic-on 信号 发 送 text rgb 或 graph _rgb 信号 至 
输出 。 其 关键 部 分 代码 如 下 : 
always @ * 
if ( — video on) 
rgb_next = "000" ; // ZAAK 折 回 
else 
// 显示 得 分 ,规则 ,或 者 游戏 结束 
if ( text on[3] II 
( (state reg == newgame) && text on[1]) 11 
((state reg == over) && text on[0]) ) 
гер next = text. rgb; 
elseif (graph. on) //display graph 
rgb next = graph rgb; 
elseif (text on[2]) // ERRE 
rgb next = text. rgb; 
else 
rgb. next =3'b110; // 黄色 背景 
// 输出 
assign rgb = rgb тев; 
text-on [3] 信号 是 用 于 得 分 ,会 一 直 显 示 。text-on [1] 信号 是 用 于 规则 ， 
仅 在 状态 机 处 于 newgame 状态 时 显示 。 同 样 ， 游 戏 结束 信息 的 状态 由 text-on 
[0] 信号 显示 ， 仅 在 状态 机 在 over 状态 时 显示 。Logo 的 状态 由 text-on [2] 信号 
显示 ， 它 作为 背景 的 一 部 分 使 用 ， 仅 在 没有 其 他 声明 信和 号 时 显示 。 
完整 代码 如 示例 14. 10 所 示 。 
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示例 14.10 ”状态 机 游戏 顶层 系统 


module pong top 


( 
Input wire clk „reset, 
input wire[ 1 :0 ] btn, 
output wire hsync , vsync , 
output wire[ 2 :0 | rgb 
); 
// 符号 状态 声明 


localparam| 1 ;0 ] 
newgame =2' b00, 
play 22' b01, 
newball =2’ b10, 
over =2 bll; 
// f FAA 
reg[ 1:0] state reg, state next; 
wire[9:0] pixel x, pixel y ; 
wire video on, pixel tick, graph on, hit, miss; 
wire[3:0] text on; 
wire[ 2:0] graph rgb, text rgb ; 
reg[ 2:0] rgb reg, тер next ; 
wire[ 3:0] dig0 digl ; 
reg gra still, d inc, d clr, timer start ; 
wire timer tick, timer up; 


reg[ 1:0] ball reg , ball next ; 


Z/=—Aa asss 
// 实例 
 ——————— 
// 视频 同步 单元 实例 


vga-sync vsync unit 
(. elk(clk) , . reset (reset), . hsyne(hsyne), . vsync(vs ~ пс), 
. video on(video on), . p_tick( pixel tick), 
. pixel. x(pixel x), .pixel y(pixel y)); 
// 文本 模块 实例 
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pong _text text _unit 
(. elk (clk) , 
. pix x(pixel x),.pix y(pixel y), 
. dig0( 4190) ,. digl( digl) ,. ball(ball гер), 
.text on(text on),.text rgb(text rgb)) ; 
// 图 形 模 块 实例 
pong graph graph unit 
(. elk( elk) ,. reset( reset) ,. btn( Ып), 
.pix x(pixel x),. pix y(pixel y), 
.gra _still( gra still) ,. hit( hit) ,. miss( miss) , 
. graph on(graph on),. graph rgb(graph rgb)); 
//2s THERE S ffi] 
//60 Hz tick 
assign timer tick = (pixel x 220) && ( pixel y 220); 
timer timer unit 
(. elk( clk) ,. reset( reset) ,. timer tick(timer tick), 
. timer start(timer start) ,. timer up(timer up)); 
//2 ti Fili E ЭЙ] 
m100-counter counter unit 
(. elk(c1k),. reset(reset) ,. d inc(d inc) ,. d clr(d clr), 
. 4р0 ( 4100) ,. dig] ( dig) ) ; 


// FSMD 状态 & 数据 寄存 静 
always @ ( posedge clk, posedge reset) 
if( reset) 
begin 
state reg <= newgame ; 
ball reg <=0 ; 
rgb reg <=0 ; 
end 
else 
begin 


State reg <= state next; 
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ball reg <= ball next; 
if( pixel. tick) 
rgb reg <= rgb. next ; 
end 
// FSMD {КЖ 
always @ * 
begin 
gra_still=1’ bl; 
timer start = 1” b0; 
d inc =1’b0; 
d_clr=1’b0; 
state next = state _reg; 
ball next = ball reg; 
case(state reg) 
newgame ; 
begin 
ball. next =2’ b11;// =F ER 
d clrz1' bl ;7/ 得 分 清 零 
if( btn! =2b00)// f£ РЕТ 
begin 
state. next = play; 
ball next = ball reg 1; 
end 
end 
play: 
begin 
gra still =1 b0; // shi BE dc 
if( hit) 
d inc 2 1' bl ; // 增加 得 分 
elseif( miss ) 
begin 
if( ball reg 220) 
state next = over; 
else 


state next = newball ; 
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timer start = 1° bl ;⁄/2s ТН 
ball next = ball reg 1; 


end 
end 
newball : 
// 等 待 2s НЯ РА 


if(timer up&&( btn! 22' b00) ) 
state. next = play; 
over: 
// 等 竺 2s 显示 游戏 结束 
if(timer up) 
state next = newgame ; 


endcase 


PE 区 生硬 ее ооо 


always @ * 
if( ~ video on) 
rgb. next = "000" ;// Z AWAY dr Inl 
else 
// 显示 得 分 ,规则 ,或 者 游戏 结束 
if(text on[3] || 
( (state reg == newgame) && text on[1]11 // 规则 
( (state reg == over) && text on[0]) 
rgb next = text. rgb; 
elseif( graph. on) // fi zw Л 
rgb next = graph rgb; 
elseif( text on[2]) // 显示 标志 
rgb next = text гер; 
else 
rgb. next =3'b110; // 黄色 背景 
// 输出 
assign rgb = rgb reg; 
endmodule 


第 14 章 VGA ИП: 示例 - 415 · 





14.5 文献 备注 


可 以 用 到 几 种 不 同 特征 的 字体 。Rapid Prototyping of Digital Systems 由 
James. 0. Hamblen 等 使 用 压缩 的 64 字符 8 * 8 字体 设置 。 分 片 映射 图 像 对 文本 显 
示 没 有 限制 ， 在 早期 的 视频 游戏 中 广泛 使 用 。Steven Collins ( ACMSIGGRAPH, 
May 1998) 的 文章 《8 位 计算 机 游戏 时 代 期 间 的 计算 机 制图 》 全 面 地 回顾 了 基于 
分 片 模式 游戏 的 历史 和 设计 技术 。 


14.6 实验 


14.6.1 旋转 旗帜 


旋转 旗帜 在 监控 屏幕 从 右 到 左 移 动 和 旋转 。 它 类 似 于 Windows 的 Marquee BË 
幕 保护 。 让 旗帜 上 的 文本 是 “Hello, ЕРСА World”。 标 语 应 该 以 四 种 不 同 字体 大 
小 显示 ， 而 且 能 以 四 种 不 同 的 速度 传播 。 字 体 的 大 小 和 速度 由 4 个 开关 控制 。 编 
写 HDL 描述 ， 然 后 综合 ， 最 后 验证 电路 的 功能 。 


14.6.2 指针 的 下 划 线 


在 14.3 节 中 ， 全屏 文 本 显示 电路 使 用 反 色 显 示 当 前 指针 的 位 置 。 将 设计 更 
改 为 使 用 下 划 线 来 显示 指针 位 置 。 编 写 HDL 描述 ， 然 后 综合 ， 最 后 验证 电路 功 
能 。 


14.6.3 双 模 式 文本 显示 


有 时 对 文本 最 好 在 屏幕 上 垂直 显示 ， 这 能 够 通过 旋转 监控 器 90° 然 后 停留 在 
它 的 一 侧 来 实现 。 按 以 下 方法 设计 电路 : 

1) 在 14.3 节 中 将 全 屏 文本 显示 更 改 为 垂直 屏幕 显示 ; 

2) 为 了 创造 “ 双 模 式 ” 文 本 显示 ， 将 水 平和 垂直 设计 合并 ， 使 用 一 个 开关 
来 选择 期 望 的 模式 ; 

3) 编写 HDL 描述 ， 然 后 综合 ， 最 后 验证 电路 功能 。 


14.6.4 键盘 文本 输入 


代替 开关 和 按钮 ， 更 自然 的 是 使 用 键盘 文本 输入 。 我 们 可 以 使 用 4 个 箭头 键 
来 移动 指针 ， 使 用 常规 键 输入 字符 。 使 用 键盘 界面 设计 新 电路 已 在 9. 4 节 讨 论 。 
编写 HDL 描述 ， 然 后 综合 ， 最 后 验证 电路 功能 。 
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14.6.5 UART 终端 


UART 终端 收 到 来 自 UART 端口 的 输入 ， 然 后 在 监控 器 上 显示 收 到 的 字符 。 
当 连 接 PC 串口 时 ， 应 该 在 Window 超级 终端 回放 该 文本 。 具 体 细节 如 下 : 

e 指针 用 来 显示 当前 的 位 置 ; 

e `“ “carriage return” 被 赋值 0de 时 ， 屏 幕 开 始 一 条 新 的 线路 ; 

9 当 输 入 到 80 个 字符 后 该 行 跳 转 〈 即 ， 开 始 新 的 行 ) ; 

e 当 指针 到 达 屏 幕 的 底部 时 〈 即 ， 最 后 一 行 ) ， 第 一 行将 被 丢弃 ， 所 有 其 他 
行将 会 上 提 一 个 位 置 ( 即 ，scroll up), 

编写 HDL 描述 ， 然 后 综合 ， 最 后 验证 电路 功能 。 


14.6.6 方 波 显示 
通过 利用 图 14-7a 中 显示 的 4 个 简单 的 片段 图 案 ， 我 们 能 绘制 一 个 方 波 。 下 

















面 是 14.3 节 中 全 屏 文本 的 显示 过 程 ， 
目的 是 设计 全 屏 波形 编辑 器 : | | | | 
1) 设置 片段 的 尺寸 是 8 x 64, 
为 4 副 图 案 创建 ROM K; 图 案 码 о O 10 
2) 计算 在 640 x 480 分 辩 率 的 屏 ЕНЕ 
幕 上 片段 的 数量 ， 同 时 为 片段 存储 分 жиын 0 0 0 01 1 110000 
配合 适 的 配置 ; Pr 
3) 使 用 3 个 控制 按钮 和 2 位 用 om. MW ap AL 
于 模式 进入 的 开关 ; 00 00 
4) 编写 HDL 描述 ， 然 后 综合 ， b) 对 采样 值 进行 编码 
最 后 验证 电路 功能 。 图 14-7 方 波 的 片段 图 案 和 编码 


14.6.7 简单 的 四 路 逻辑 分 析 器 


边 辑 分 析 器 显示 了 数字 信号 集 的 波形 。 我 们 想 要 设计 一 个 简单 的 逻辑 分 析 
器 ， 它 能 采样 四 输入 信号 在 “自由 航行 ”模式 下 的 波形 。 代 替 使 用 触发 模式 ， 
按钮 开关 被 激活 时 开始 数据 采样 。 简 单 地 ， 我 们 假设 输入 波形 的 频率 范围 在 10 
~100kHz。 电 路 可 以 按 下 面 的 方法 来 设计 : 

1) 使 用 采样 周期 脉冲 来 采样 四 输入 信号， 确保 选择 合适 的 速率 ， 以 便 期 望 
的 输入 频率 范围 可 以 在 屏幕 上 完全 显示 ; 

2) 对 于 采样 信号 点 ， 它 的 值 能 被 编码 成 包含 前 一 点 值 的 片段 模式 ， 例 如 ， 
如 果 一 个 信号 的 采样 顺利 是 “0000 1111 000”， 片 段 模式 变 成 “00 00 00 01 11 
11 11 10 00 00”， 如 图 14-7b Bras; 
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3) 按照 前 述 方 波 实验 过 程 来 设计 片段 存储 器 和 为 显示 4 个 存储 波形 的 视频 
界面 ; 

4) 编写 HDL 描述 ， 然 后 综合 ， 最 后 验证 电路 功能 。 

为 了 验证 电路 功能 ， 我 们 能 通过 前 端的 原型 板 连接 4 个 外 部 信号 。 或 者 ， 我 
们 可 以 设计 一 个 顶层 测试 模型 ， 它 包括 一 个 Abit 的 计数 器 (Вр, AKA 50 kHz 的 
十 进 制 计数 器 ) 和 逻辑 分 析 器 ， 重 新 综合 电路 ， 验 证 其 功能 。 


14.6.8 完整 的 双人 乒乓 游戏 


ТЕ 13.7.6 节 的 实验 描述 了 自由 运行 式 双人 乒乓 游戏 。 按 照 14. 4 节 乒 乓 游戏 
的 过 程 来 设计 整个 系统 。 这 个 系统 设计 应 该 包括 一 个 新 文本 显示 分 系统 的 设计 和 
顶层 有 限 状 态 机 控制 器 的 设计 。 编 写 HDL 语言 描述 设计 ， 然 后 综合 ， 最 后 验证 
电路 功能 。 


14.6.9 完整 的 通关 游戏 


在 13.7.7 节 的 实验 中 描述 了 自由 运行 式 通关 游戏 。 按 照 14. 4 节 乒 乓 游戏 的 
过 程 来 设计 整个 系统 。 应 该 包括 一 个 新 文本 显示 分 系统 设计 和 顶层 有 限 状 态 机 控 
制 器 的 设计 。 编 写 HDL 语言 描述 设计 ， 然 后 综合 ， 最 后 验证 电路 功能 。 


pem ue 
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15.1 简介 


PicoBlaze 处 理 器 是 Xilinx FPGA 芯片 的 一 种 紧凑 的 8 位 微 控 制 器 核 。 它 是 由 
单元 级 HDL 描述 〈 即 软 核 ) ， 可 以 伴随 其 他 的 逻辑 而 综合 。PicoBlaze 最 大 的 优势 
是 效率 高 ， 而 且 仅 占用 大 约 200 个 逻辑 单元 ， 少 于 35200 器 件 资 源 的 5% 。Pi- 
coBlaze 没有 被 设计 成 一 种 高 性 能 处 理 器 ， 它 具有 很 好 的 紧凑 性 和 灵活 性 ， 可 以 
用 来 进行 简单 的 数据 处 理 和 控制 ， 尤 其 是 用 作 非 时 序 的 看 门 狗 ( housekeeping) 
Ail 1/0 操作 。PicoBlaze 处 理 器 可 以 很 方便 地 组 合成 一 个 较 大 的 系统 和 增强 基于 
FPGA 的 设计 的 灵活 性 。 

尽管 具体 的 汇编 程序 以 及 微 控 制 器 的 详细 描述 在 本 书 中 没有 涉及 ， 但 该 章节 
对 PicoBlaze 的 组 织 架 构 以 及 指令 集 进行 了 全 面 地 阐述 ， 同 时 通过 一 系列 具体 的 
例子 说 明了 如 何 使 用 汇编 语言 进行 开发 和 描述 VO 接口 。 另 外 ， 本 章 回顾 了 Pi- 
coBlaze 的 组 织 架 构 以 及 指令 集 ， 在 16 章 中 介绍 了 汇编 语言 编程 ， 在 17 章 和 18 
章 中 讨论 了 通用 的 LO 接口 和 中 断 接 口 。 


15.2 定制 硬件 和 软件 


15.2.1 从 专用 FSMD 到 通用 微 控制 器 


RTL 级 设计 以 及 在 第 6 章 中 介绍 的 FSMD 为 将 一 个 连续 的 算法 转化 成 定制 的 
硬件 提供 了 通用 的 方法 。 重 新 排列 的 方块 图 见 图 15-1a。 在 FSMD 中 ， 所 有 的 组 
成 部 分 ， 包括 寄 存 器 数量 、 寄 存 器 的 输入 /输出 路 径 、 函 数 单元 的 数量 和 类 型 以 
及 FSM 的 控制 部 分 都 被 根据 特定 的 应 用 而 排列 。 如 图 所 示 ， 数 据 路 径 可 能 包含 
多 种 的 函数 单元 和 传输 路 径 。 

对 于 不 同 的 应 用 ， 一 种 折 中 的 方法 就 是 保持 硬件 不 变 而 使 用 定制 的 软件 。 转 
化 的 方式 如 下 所 述 。 首 先 ， 如 图 15-1Ь 顶层 所 示 ， 使 用 一 种 特定 的 结构 来 替换 定 
制 的 数据 路 径 。 数 据 寄存 器 和 定制 的 传输 网 络 由 一 个 寄存 器 文件 来 蔡 换 ， 这 一 文 
件 具 有 特定 数量 的 寄存 器 以 及 只 包含 两 个 读 端口 和 一 个 写 端口 。 而 定制 的 函数 单 
元 由 一 个 ALU (算术 逻辑 单元 ) BK, Н ALU 只 能 执行 一 系列 预先 定义 的 函 
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数 。 这 样 ， 数 据 路 径 只 能 按照 下 面 的 格式 来 执行 代码 : 

rd«—rl op 12 
Н, rl, 12 I rd 表示 两 个 源 寄 存 器 和 一 个 目的 寄存 器 的 地 址 ，op 表示 一 种 可 
用 的 ALU 函数 。 














控制 控制 控制 状态 








a) FSMD 框 图 


替换 数据 寄存 器 和 路 径 














ңе 
替换 次 态 逻 辑 替换 状态 寄存 器 替换 输出 逻辑 
b) 微 控制 器 的 简化 框图 


图 15-1 FSMD 和 微 控制 器 图 
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其 次 ， TRA raat FSM, ЖП 15-1Ь fas. i5 
行 FSM 包含 3 个 步骤 : 

e 状态 机 寄存 器 明确 表示 现 态 ; 

e 输 出 逻辑 根据 现 态 给 出 特定 的 输出 信号 ; 

o 次 态 逻 辑 决定 新 状态 。 

可 编程 状态 机 按照 如 下 步骤 对 上 述 步骤 进行 修改 : 

e 使 用 程序 计数 器 蔡 代 状态 寄存 器 ， 计 数 器 的 内 容 表示 控制 路 径 上 的 现 态 ; 

e 在 FSM 中 ， 每 一 个 状态 都 产生 确定 的 输出 信号 ， 从 而 来 控制 数据 路 径 的 
操作 ， 可 编程 状态 机 将 这 些 输出 模式 编码 成 指令 ， 并 将 其 存储 在 一 个 存储 器 模块 
中 ， 称 为 程序 存储 器 或 指令 存储 器 ， 一 个 存储 器 地 址 对 应 一 个 程序 计数 器 的 状态 
( 即 一 个 数值 ) ， 在 执行 过 程 中 ， 需 要 从 存储 器 中 重新 读 取 程序 计数 器 所 指向 的 
指令 ， 然 后 对 其 进行 译 码 ， 从 而 得 到 控制 信号 ， 指 令 存储 器 和 译 码 逻 辑 功 能 块 是 
一 个 成 熟 的 输出 逻辑 电路 ; 

e {Е FSM 中 ， 状 态 跳 转 到 哪里 是 没有 限制 的 ，FSM 通过 检查 输入 条 件 ， 可 
以 从 给 定 的 现 态 跳 转 到 多 个 可 能 的 次 态 中 的 任 一 个 ， 而 在 可 编程 状态 机 中 ， 次 态 
通常 是 现 态 加 1 的 值 〈 即 程序 计数 器 是 逐 1 递增 的 ) ， 这 恰好 反映 了 顺序 执行 的 
本 质 ， 顺 序 执 行 只 能 被 几 个 特定 的 指令 所 改变 ， 例 如 jump 指令 ， 通 过 该 指令 程 
序 计数 器 被 装 入 不 同 的 值 ， 加 法 器 及 与 其 相关 的 多 路 逻辑 功能 块 是 一 个 简单 的 次 
态 逻 辑 电 路 。 

通过 将 数据 路 径 替 换 为 一 个 寄存 器 文件 和 一 个 ALU， 同 时 使 用 可 编程 状态 
机 替换 FSM， 定 制 系统 的 过 程 也 就 等 同 于 开发 一 个 指令 次 序 〈 即 开发 一 个 软件 
程序 ) 以 及 将 指令 加 载 到 指令 存储 器 中 。FSMD 的 组 织 架构 对 于 不 同 的 应 用 是 不 
变 的， 形成 了 一 个 通用 的 硬件 平台 。 该 平台 构成 了 PicoBlaze 微 控制 器 的 基本 骨 
Ж, 


15.2.2 ” 微 控 制 器 的 应 用 


在 定制 的 FSMD 中 ， 数 据 路 径 可 以 适应 单一 的 应 用 需求 。 它 可 以 包含 多 种 定 
制 的 功能 单元 和 并 行路 径 ， 同 时 可 以 在 单一 状态 〈 即 一 个 时 钟 周期 ) 中 完成 复 
杂 的 运算 。 另 外 ，PicoBlaze 微 控制 器 每 次 只 能 完成 一 个 预先 确定 的 RT 操作 (Вр 
一 个 指令 ) 。 若 要 完成 相同 的 任务 ， 则 需要 较 多 的 指令 ， 当 然 需 要 花费 更 多 的 时 
间 。 

许多 任务 可 以 通过 一 个 定制 FSMD 或 一 个 微 控 制 器 来 完成 。 人 们 所 寻求 的 就 
是 硬件 复杂 度 及 性 能 与 开发 简易 性 之 间 的 平衡 。 这 里 没有 精确 的 准则 来 告诉 人 们 
去 选择 哪 一 个 。 因 为 开发 软件 的 过 程 通常 比 制造 定制 硬件 要 简单 ， 所 以 微 控制 器 
一 般 更 适合 对 时 序 要 求 不 是 很 严格 的 应 用 。 我 们 可 以 通过 分 析 计算 的 复杂 度 来 确 
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定 选择 的 可 行 性 。PicoBlaze 执行 一 个 指令 需要 两 个 时 钟 周 期 。 假如 系统 时 钟 是 
50MHz, 25, 000, 000 条 指令 可 以 在 1s 内 完成 。 对 于 一 个 任务 (或 一 系列 任 
务 ) ， 我 们 可 以 分 析 需 要 多 大 的 频率 以 及 任务 必须 完成 的 速度 ， 进 而 分 析 得 到 可 
用 的 指令 的 数目 。 例 如 ， 假 定 键盘 接口 每 lms 产生 新 的 输入 数据 ， 且 数据 必须 
在 该 时 间 段 内 处 理 。 在 lms 的 周期 内 ，PicoBlaze 能 够 执行 25 000 条 指令 。 若 某 
一 必须 的 处 理 过 程 能 够 在 25, 000 条 指令 内 完成 ，PicoBlaze 控制 器 是 一 个 可 行 的 
选择 。 总 而 言 之 ， 微 控制 器 适用 于 许多 对 时 序 要 求 不 严格 的 L/O 接口 或 常规 任 
务 。 


15.3 PicoBlaze 概述 


15.3.1 基本 组 成 


PicoBlaze 是 一 个 紧凑 的 8 位 微 控 制 器 ， 其 特征 如 下 : 
‚ © 8 位 数据 宽度 ; 

e 8 位 ALU (具有 进位 和 零 标志 ) ; 

e 16 个 8 位 通用 寄存 器 ; 

e 64 字 节 数据 存储 器 ; 

e 18 位 指令 位 宽 ; 

e 10 位 指令 地 址 ， 支 持 最 高 1024 条 指令 ; 

e 31 字 调 用 /返回 堆栈 ; 

e 256 个 输入 端口 和 256 个 输出 端口 ; 

e 执 行 一 条 指令 需 两 个 时 钟 周期 ; 

e 执行 一 个 中 断 操作 需 5 个 时 钟 周期 。 

PicoBlaze 基于 如 图 15-1b 所 示 的 框架 ， 通 过 增加 一 些 扩 展 可 以 使 其 功能 更 强 
大 。 其 框图 如 图 15-2 所 示 。 为 了 表示 得 更 清晰 ， 图 中 只 给 出 了 主要 的 数据 流 。 
主要 存储 部 件 的 大 小 列 在 括号 中 。 该 处 理 器 在 初始 框架 的 基础 上 可 以 做 如 下 扩 
展 : 

e 增加 64 位 字 长 的 数据 存储 器 ， 在 Xilinx 产品 中 被 称 为 可 擦 除 RAM, fex 
里 被 称 为 数据 RAM， 数 据 RAM 可 以 被 看 做 一 个 容器 ， 用 来 存储 额外 的 数据 ， 需 
要 注意 的 是 ， 在 数据 RAM 和 ALU 之 间 没 有 直接 的 通信 路 径 ， 数 据 必 须 从 寄存 器 
中 读 出 进行 处 理 ， 然 后 再 返 存 到 数据 RAM rh; 

e 在 某 些 指令 中 增加 立即 数 区 ， 这 使 得 常数 ， 而 非 寄 存 器 的 内 容 ， 可 以 在 
ALU 或 其 他 操作 中 使 用 。 在 ALU 底层 输入 前 的 2-1 多 路 选择 器 被 用 来 选择 寄存 
器 输出 或 常数 区 ; 
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e 增 加 31 字 长 的 堆栈 ， 支 持 功能 调用 ， 调 用 和 返回 流程 将 在 15.5.8 节 详 细 
描述 ; 
e@ 增 加 路 径 实现 外 部 数据 的 输入 、 输 出 ， 使 用 8 位 的 port id 信和 号 来 确定 端 
口 ， 进 而 扩展 到 256 个 输入 端口 和 256 个 输出 端口 ，LO 接口 将 在 第 17 章 详 细 
描述 ; 


e 增 加 中 断 处 理 电路 〈 图 中 未 给 出 ) ， 中 断 机 制 将 在 第 18 章 详细 描述 。 
数据 存储 器 地 址 








—- Out port 
» port id 














in port 








; 译 码 IL. 
(IkX18) | 逻辑 EM 





指令 存储 器 地 址 指令 
外 部 处 理 器 模块 
Р 15-2 PicoBlaze 框图 


15. 3.2 顶层 HDL 模块 


在 综合 过 程 中 ，PicoBlaze 系统 由 两 个 顶层 模块 构成 ， 如 图 15-3 所 示 。 
KCPSM3 模块 是 PicoBlaze 处 理 器 ， 表 示 由 可 编程 状态 机 编码 的 常数 (K), ， 同 时 
反映 了 PicoBlaze 处 理 器 的 初始 名 称 。 其 输入 、 输 出 信号 如 下 所 示 : 

e ск (MA, 117): 系统 时 钟 信号 ; 

€ reset (7A, 112): 复位 信和 号; 

ө address (输出 ，10 位 ) : 指令 存储 器 地 址 ， 指 定 读 取 指 令 时 的 位 置 ; 

€ instruction (输入 ，18 (7): fetched 指令 ; 
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in port out port 
clk 一 一 reset port_id 
Р read strobe 
instruction с 

write strobe 
interrupt interrupt. ack 


address 





KCPSM3 


Р 15-3 PicoBlaze 顶层 图 


e port id (输出 ，8 fiz): 输入、 输出 端口 地 址 ; 

€ in port (输入 ,8 位 ): 外 部 I/O 输入 数据 ; 

€ read storbe (输出 ，1 位 ) : 与 输入 操作 相关 的 开关 信号 ; 

€ out port (输出 ，8 位 ) : 输出 给 外 部 LO 数据 ; 

€ write storbe (输出 ，1 位 ) : 与 输出 操作 相关 的 开关 信和 号 ; 

© interrupt (A, 1 位 ) : 外 部 VO 中 断 请 求 信和 号; 

€ interrupt аск (输出 ，1 位 ) : 输出 给 外 部 WO 的 中 断 应 答 信 号 。 

第 二 个 模块 实现 指令 存储 器 。 在 开发 过 程 中 ， 通 常 将 已 编译 的 汇编 代码 预先 
存 人 存储 器 中 ， 然 后 以 HDL 编码 的 形式 将 其 配置 成 ROM， 即 指令 ROM, 


15.4 开发 流程 


在 基于 传统 的 微 控 制 器 开发 系统 时 ， 需 要 分 析 需 求 的 功能 项 ， 从 而 选择 具有 
合适 的 计算 能 力 以 及 IO 接口 的 处 理 器 。 通 常 还 需要 额外 的 芯片 来 实现 特定 的 功 
能 。 使 用 软 核 微 控制 器 的 一 大 优势 就 是 不 仅 可 以 使 用 其 中 的 定制 电路 ， 而 且 还 可 
以 利用 相同 FPGA 芯片 中 配置 的 微 控制 器 。 大 量 的 应 用 通常 包含 许多 不 同 的 任 
务 。 在 一 个 FPGA 平台 中 ， 利 用 定制 电路 ( 即 所 谓 的 硬件 ) 可 以 实现 有 严格 时 
序 要 求 的 任务 ， 而 利用 微 控 制 器 ( 即 所 谓 的 软件 ) 则 可 以 实现 剩余 的 常规 功能 
和 低速 VO 功能 。 

基于 PicoBlaze 的 开发 流程 如 图 15-4 所 示 ， 包 含 如 下 的 步骤 : 

1) 合理 划分 软件 和 硬件 部 分 ; 

2) 为 软件 部 分 开发 汇编 程序 ; 

3) 编译 汇编 程序 ， 生 成 指令 ROM, iZ ROM 是 HDL 文件 ; 

4) 执行 指令 集 级 别 仿真 ; 

5) 获得 硬件 部 分 的 HDL 代码 ， 该 硬件 包含 用 来 实现 特定 的 IO 功能 和 严格 
时 序 要 求 的 电路 功能 以 及 具有 PicoBlaze 的 接口 ; 


% 15 # PicoBlaze 概述 - 427 · 











ЕРСА 
芯片 


图 154 基于 PicoBlaze 的 系统 开发 流程 图 


6) 编制 顶层 HDL 代码 ， 实 现 与 PicoBlaze 核 、 指 令 ROM 以 及 定制 硬件 的 连 
接 ; 

7) 开发 testbench ， 进 行 整 个 系统 的 HDL 级 仿真 ; 

8) 完成 HDL 代码 的 综合 实现 ， 并 在 电路 板 上 对 FPGA 芯片 编程 。 

上 述 各 步骤 的 详细 描述 将 在 后 续 章 节 中 给 出 。 

步骤 9 如 图 中 虚线 所 示 ， 该 步骤 不 是 正常 开发 流程 的 一 部 分 。 该 步骤 实现 指 
令 存储 器 在 系统 综合 后 的 重 加 载 。 该 步骤 将 在 16. 5.3 节 中 讨论 。 
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15.5 指令 集 


PicoBlaze 共有 57 条 指令 。 这 些 指 令 具 有 5 种 格式 。 按 照 具体 的 执行 形式 将 
其 分 成 如 下 几 种 类 型 : 

өн; 

e 算 术 指 令 ; 

e 比较 和 检验 指令 ; 

e 移 位 和 循环 指令 ; 

e 数 据 传 输 指 令 ; 

e 编程 流程 控制 指令 ; 

e 与 中 断 相 关 的 指令 。 

在 该 部 分 ， 首 先 分 析 编 程 模式 和 指令 格式 ， 然 后 依次 列 出 和 解释 各 指令 。 


15.5.1 编程 模式 


以 汇编 编程 为 例 ，PicoBlaze 包含 16 个 8 位 寄存 器 ，1 个 64 字 节 的 数据 
RAM, 3 个 标志 信号 〈 堆 标志、 进位 标志 和 中 断 标志 ) ， 编 程 计数 器 和 堆栈 栈 顶 
指针 。 编 程 模式 有 时 又 被 称 作 指令 集 架 构 ， 如 图 15-5 所 示 。 一 条 指令 执行 后 ， 
这 些 部 分 的 内 容 会 显 式 或 者 隐 式 地 改变 。 与 各 指令 相关 的 操作 将 在 15.5.3 节 讨 
论 。 











00 
01 
02 
03 
50 
51 
s2 
s3 
sc 3C 
sd 3D 
se 3E 
sf 3F [i] 
寄存 器 文件 数据 RAM 指令 存储 器 调用 /返回 堆栈 — 标志 
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(ERAN РТА УУ Желк 1 Йй mj EU RAT VAI — d EE Ж: 

e sX, sY: 每 一 个 代表 16 个 通用 寄存 器 中 的 其 中 之 一 ， 其 中 的 X 和 了 表示 
0 到 f 十 六 进 制 值 ; 

ө рс: 程序 计数 器 ; 

ө 105: 堆栈 栈 顶 指针 ; 

€ c, z, i: 进位 标志 、 零 标志 和 中 断 标 志 ; 

e KK; 8 位 常数 或 端口 ia， 通常 被 表示 为 两 个 十 六 进 制 数 ; 

e SS; 6 位 常数 ， 表 示 数 据 存储 器 地 址 ， 通 常 被 表示 为 两 个 十 六 进 制 数 ; 

ө AAA: 10 位 常数 ， 表 示 指 令 存 储 器 地 址 ， 通 党 被 表示 为 3 个 十 六 进 制 数 。 


15.5.2 指令 格式 


在 汇编 程序 中 ,通常 遵循 HDL 代码 中 的 编程 惯例 : 关键 字 GES) 用 黑体 
描述 ， 常 量 用 大 写字 母 描述 。PicoBlaze 的 指令 有 5 种 格式 : 

€ op sX, sY: register-register format, op 表示 操作 ，sX 和 sY 表示 操作 数 ， 
其 中 sX 也 被 当做 目的 寄存 器 。 即 实现 sX«—sX op sY ЊЕ; 

è op sX, KK: register-constant format, ZRI 5j register-register 格式 类 似 ， 
区 别 在 于 第 二 个 操作 数 换 成 了 立即 数 ， 即 实现 sX<—sX op KK 操作 ; 

€ op sX; single-register format， 该 格式 用 在 移 位 和 循环 指令 中 ， 只 包括 一 个 
操作 数 ， 即 实现 sX< op sX 操作 ; 

è op AAA; single-address format， 该 格式 用 在 跳 转 和 调用 (call) 指令 中 ， 
AAA 表示 指令 存储 器 的 地 址 。 当 指定 的 条 件 满足 时 ，AAA 被 装订 到 程序 计数 器 
"s 

€ op: zero-operand format， 该 格式 用 在 一 些 多 样 的 指令 中 ， 这 些 指令 不 包含 
任何 操作 数 。 

针对 PicoBlaze， 有 两 种 汇编 程序 : 来 自 Xilinx 的 KCPSM3 以 及 来 自 Mediatro- 
nix 的 PBlazeIDE。 这 两 种 程序 对 于 某 些 指令 使 用 不 同 的 记忆 法 。 在 接 下 来 的 章节 
中 ，PBlazeIDE 中 使 用 的 可 选择 的 描述 方式 将 在 括号 中 注 明 。 


15.5.3 ”逻辑 指令 


PicoBlaze 有 6 条 逻辑 指令 ， 完 成 and or 和 xor 操作 。 指 令 完成 两 寄存 器 或 
寄存 器 与 常数 之 间 的 位 逻辑 操作 。 进 位 标志 c 经 常 忽略 不 计 。 零 标志 z 反映 操作 
结果 。 指 令 的 描述 方式 、 简 单 介绍 和 伪 操 作 如 下 所 述 : 

@ and sX, sY 

-位 与 操作 
- 伪 操作 : 
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sX«—sX & sY; 
c—0; 

@ and sX, KK 
-位 与 操作 
- 伪 操 作 : 
sX«—sX & KK; 
c—0; 

€ or sX, sY 
-位 或 操作 
- 伪 操 作 : 
sX«—sX | sY; 
c0; 

€ or sX, KK 
-位 或 操作 
- 伪 操 作 : 
sX<—sX | KK; 
c0; 

€ xor sX, sY 
-位 异 或 操作 
AME: 
sX«—sX ^ sY; 
c—0; 

€ xor sX, KK 
-位 异 或 操作 
- 伪 操 作 : 
sX<—sX ^ KK; 
с<0; 


15.5.4 算术 指令 


PicoBlaze 有 8 条 算术 指令 ， 完 成 带 有 或 不 带 有 进位 标志 的 加 法 和 减法 操作 。 


进位 标志 с 和 零 标志 z 反映 操作 结果 。 指 令 的 描述 方式 、 简 单 介绍 和 伪 操 作 如 下 
Ж: 


€ add sX, sY 
-不 带 进 位 的 加 操作 
- 伪 操 作 : 
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sX<—sX +sY; 
ө add sX, KK 
-不 带 进位 的 加 操作 
- 伪 操 作 : 
sX<—sX + KK; 
@ addcy sX, sY(adde sX, sY) 
- 带 进 位 的 加 操作 
- 伪 操 作 : 
sX«—sX +sY +c; 
€ addcy sX, KK(adde sX, KK) 
- 带 进位 的 加 操作 
- 伪 操作 : 
sX—sX 十 KK +c; 
ө sub sX, sY 
-不 带 进位 的 减 操作 
- 伪 操 作 : 
sX«—sX-sY ; 
ө sub sX, KK 
-不 带 进 位 的 减 操作 
- 伪 操 作 : 
sX—sX-KK ; 
€ subcy sX, sY(sube sX, sY) 


- 带 进位 的 减 操作 (标志 位 被 当做 借 位 使 用 ) 


- 伪 操 作 : 
sXe—sX-sY-c; 
€ subcy sX, KK(subc sX, KK) 


- 带 进位 的 减 操作 (标志 位 被 当做 借 位 使 用 ) 


- 伪 操作 : 
sX<—sX-KK-c; 


15.5.5 ”比较 和 检验 指令 


比较 和 检验 指令 对 两 寄存 器 或 寄存 器 和 常数 进行 检查 分 析 ， 并 相应 地 给 出 进 


位 和 零 标 志 。 寄 存 器 的 内 容 保持 不 变 。 该 指令 通常 用 在 与 条 件 性 跳 转 指令 或 调用 
指令 的 连接 上 ， 其 操作 基于 标志 位 的 值 。 


比较 指令 执行 减法 操作 ， 执 行 结 果 用 来 给 出 进位 和 零 标志 而 不 存 和 寄存 器 
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中 。 指 令 的 描述 方式 、 简 单 介绍 和 伪 操 作 如 下 所 述 ; 
@ compare sX, sY(comp sX, sY) 
-对 两 寄存 器 进行 比较 并 给 出 标志 位 
- 伪 操 作 : 
if sX = =sY then z—1 else z—0; 
if sX >sY then c—1 else с«0; 
€ compare sX, KK(comp sX, KK) 
-对 寄存 器 和 常数 进行 比较 并 给 出 标志 位 
- 伪 操作 : 
if sX = = KK then z—1 else 2—0; 
if sX > KK then c—1 else c0; 
检验 指令 执行 与 操作 ， 结 果 用 来 给 出 标志 位 而 不 存 人 寄存 器 中 。 如 果 结 果 是 
0， 则 和 零 标志 置 1。 同 时 ， 结 果 输 入 到 一 个 8 с. 从 而 得 到 奇 校 
验 结果 。 若 结果 中 包含 奇数 个 1， 则 进位 标志 置 1。 指 令 的 描述 方式 、 简 单 介绍 
和 伪 操 作 如 下 所 述 。 其 中 , t 是 8 位 的 中 间 结 果 ， fasi qus 
ө test sX, sY 
-对 两 寄存 器 进行 检验 并 给 出 标志 位 
- 伪 操作 : 
1<5Х & sY; 
if t ==0 then 2—1 else 2—0; 
cc1[7] ^t[6] ^ «^ 00]; 
ө test 5Х, KK 
-对 寄存 器 和 常数 进行 检验 并 给 出 标志 位 
- 伪 操 作 : 
t—sX & KK; 
if t==0 then z—1 else z—0; 
e—t[7] ^t(6] ^ = [0]; 


15.5.6 移 位 和 循环 指令 


PicoBlaze 包含 4 个 左 移 指令 ,4 个 右 移 指令 和 2 个 循环 指令 。 这 些 指令 按 
single-register 格式 执行 且 只 有 一 个 操作 数 ， 其 图 形 化 描述 见 图 15-6。 指 令 的 描述 
方式 、 简 单 介绍 和 伪 操作 如 下 所 述 : 

€ 510 sX 

- 左 移 1 位 ， 最 低位 补 0 
- 伪 操作 : 
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图 15-6 移 位 和 循环 指令 图 

sX—|sX[6: 0], 0}; 
с«8Х[7]; 

е 511 5Х 
- 左 移 1 位， 最 低位 补 1 
- 伪 操 作 : 
sX—|sX[6: 0], 1]; 
ce—sX[7]; 

€ six sX 
- 左 移 1 位 ， 最 低位 补 sX[0] 
- 伪 操 作 : 
sXe—|sX[6: 0], sX[0]}; 
ce—sX[7]; 

€ sla sX 
- 左 移 1 位 ， 最 低位 补 c 
- 伪 操 作 : 
sXe—|sX[6: 0], c}; 
c+-sX[7]; 

ө srÜ sX 
- 右 移 1 位 ， 最 高 位 补 0 
- 伪 操作 : 
sX——[0, sX[7: 1]}; 
c+—sX[0]; 


= 
x 
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ө srl sX 
- 右 移 1 位 ， 最 高 位 补 1 
- 伪 操 作 : 
8Х«—11, sX[7: 1]}; 
ce—sX[0]; 
@ srx sX 
- 右 移 1 位 ， 最 高 位 补 sX[7] 
- 伪 操 作 : 
sX«—(sX[7], sX[7: 1]}; 
c+sX[0]; 
@ sra sX 
- 右 移 1 位 ， 最 高 位 补 c 
- 伪 操 作 : 
sXe—|c, sX[7; 1]}; 
ce—sX[0]; 
e rl sX 
-循环 左 移 1 位 
- 伪 操 作 : 
sX—| sX[6: 0], sX[7]}; 
ce—sX[7]; 
ө rr sX 
-循环 右 移 1 位 
- 伪 操作 : 
sXe—| sX[0], sX[7: 1]]; 
c«—sX[0]; 


15.5.7 数据 传输 指令 


PicoBlaze 中 计算 是 通过 寄存 器 和 ALU 来 完成 的 。 数 据 RAM 提供 附加 的 存储 
空间 ， 而 L/O 端口 提供 与 外 设 的 通信 路 径 。 其 中 有 些 指令 实现 寄存 器 、 数 据 
RAM 和 L/O 端口 间 的 数据 传输 。 数 据 传输 指令 可 以 划分 为 以 下 三 种 类 型 : 

e 寄 存 器 间 : load 指令 ; 

e 寄 存 器 和 数据 КАМ [8]: fetch 和 store 指令 ; 

e 寄 存 器 和 IO 端口 间 : input 和 output 指令 。 

指令 的 描述 方式 、 简 单 介绍 和 伪 操 作 如 下 所 述 。 其 中 ，RAM [ ] 表示 数据 
RAM 的 内 容 。 需 要 指出 的 是 ，indirect address， 如 (sY) 所 示 ， 被 用 来 强调 寄存 
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器 sY 中 的 内 容 已 被 使 用 。 
€ load sX, sY 
-在 两 寄存 器 间 进 行 数 据 传输 
- 伪 操作 : 
sX—sY 
ө load sX, KK 
-将 常数 输入 寄存 器 
- 伪 操 作 : 
sX—KK 
€ fetch sX, (sY)(fetch sX, sY) 
-将 数据 从 数据 RAM 输入 到 寄存 器 
- 伪 操作 : 
sX«-RAM[ (sY) ]; 
€ fetch sX, SS 
-将 数据 从 数据 RAM 输入 到 寄存 器 
- 伪 操作 : 
sX«—RAM[ SS]; 
ө store sX, (sY)(store sX, sY) 
-将 数据 从 寄存 器 输入 到 数据 RAM 
- 伪 操 作 : 
RAM[(sY)] < sX; 
€ store sX, SS 
-将 数据 从 寄存 器 输入 到 数据 RAM 
- 伪 操作 : 
RAM[SS] — sX; 
e input sX, (5Ү) (іп sX, sY) 
-将 数据 从 输入 端口 传输 到 寄存 器 
- 伪 操 作 : 
port id +— sY; 
sX«—in port; 
è input sX, KK(in sX, KK) 
-将 数据 从 输入 端口 传输 到 寄存 器 
- 伪 操作 : 
port id — KK; 


sX<—in_port; 
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€ output sX, (sY)(out sX, sY) 
-将 数据 从 寄存 器 传输 到 输出 端口 
- 伪 操 作 : 
port id — sY; 
out port ——sX; 
@ output sX, KK(out sX, KK) 
-将 数据 从 寄存 器 传输 到 输出 端口 
- 伪 操 作 : 
port id — KK; 
out port —5Х; 
PicoBlaze 中 没有 指令 可 以 直接 实现 将 数据 传输 到 指令 存储 器 或 者 将 数据 从 指 
令 存储 器 中 取出 。 然 而 ， 许 多 指令 包含 立即 数 存储 区 。 因 为 常数 是 指令 的 一 部 分 且 
存储 在 指令 存储 器 中 ， 因 此 可 以 认为 暗含 将 数据 从 指令 存储 器 传输 到 寄存 器 中 。 


15.5.8 程序 控制 指令 


在 PicoBlaze 中 ， 程 序 计数 器 用 以 标识 指令 存放 的 地 址 。 默 认 情 况 下 ， 进 程 
执行 到 指令 寄存 器 的 下 一 个 地 址 时 程序 计数 器 自动 加 一 (Bl: pe 二 pe +1)。 
jump, call 和 return 指令 会 载 入 某 一 固定 值 用 于 程序 计数 和 程序 控制 。 这 些 指 令 
会 被 无 条 件 执行 或 依据 carry 和 zero 标志 的 值 选择 性 执行 。 

如 果 相应 的 条 件 满足 ，jump 指令 会 向 程序 指针 载 人 一 个 新 的 变量 值 。 程 序 
将 跳出 当前 的 操作 跳 转 到 新 的 地 址 空间 中 。 该 指令 执行 结束 后 程序 继续 先前 的 操 
作 。 指 令 的 关键 字 、 相 关 描 述 以 及 示例 操作 如 下 所 示 。 重 申 一 下 : AAA 表示 
lObit 的 指令 寄存 器 地 址 ，PC 表示 程序 计数 器 。 

€ Jump AAA | 

--- 无 条 件 跳 转 
— 操作 示例 : 
Рс—ААА 
е Jump c, AAA 
—carry 置 一 时 程序 跳 转 
一 操作 示例 : 
If c ==1 then рс<-ААА else рс<-рс +1; 
€ Jump nc, AAA 
---carry 置 零 时 程序 跳 转 
一 -操作 示例 : 
If c ==0 then pe—AAA else pce-pc +1; 
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@ Jump z, ААА 
---zero 置 一 时 程序 跳 转 
--- 操 作 示 例 : 


If z==1 then pe«—AAA else pepe +1; 


@ Jump nz, AAA 
---zero 置 零 时 程序 跳 转 
--- 操 作 示 例 : 


If z==0 then рс<-ААА else pepe +1; 
Call 和 return 指令 用 于 软件 函数 的 调用 。 当 函数 被 调用 时 ， 处 理 器 中 止 当前 


的 操作 并 跳 转 到 相应 的 程序 中 。 当 该 程序 
执行 结束 后 ， 处 理 器 将 返回 到 跳 转 点 继续 
执行 先前 的 操作 。 和 jump 指令 一 样 ， 如 果 


条 件 合适 的 话 call 命令 也 是 向 程序 计数 器 ， 


载 人 一 个 新 的 变量 值 。 另 外 ， 它 也 是 将 当 
前 程序 计数 器 的 值 存储 在 一 个 特殊 的 缓存 
器 中 ， 该 缓存 器 叫做 堆栈 。 新 的 地 址 表示 
程序 执行 的 起 始 节点 。 程 序 执行 结束 后 需 
要 包含 一 个 return 指令 。retum 指令 从 堆栈 
中 获取 保存 好 的 变量 值 后 自动 加 一 ， 载 人 
到 程序 计数 器 中 。 该 指令 可 以 让 操作 立即 
返回 到 原 сай 指令 调用 的 地 址 空间 中 。 典 
型 的 程序 流程 见 图 15-7。 

PicoBlaze XH PR Bik ЖОАН, Х Ж 
着 一 个 函数 可 以 被 其 他 的 函数 调用 。 为 了 


;三 三 三 三 三 三 主 程序 ттш 


返回 
图 157 子 函数 调用 的 程序 执行 过 程 


实现 这 个 功能 ， 我 们 用 一 个 后 进 先 出 的 栈 来 存储 程序 计数 器 的 值 。 在 这 个 缓冲 器 
中 ， 最 新 调用 的 函数 地 址 被 压 到 栈 顶 〈 即 : 后 进 )。 假 设 这 个 函数 里 面 不 再 调用 
其 他 的 函数 。 它 优先 被 执行 完成 后 将 返回 的 地 址 保存 到 栈 顶 。 该 地 址 从 堆栈 中 弹 
出 〈 即 : 先 出 ) 后 恢复 到 先前 的 操作 。PicoBlaze 提供 了 31 5E B HER РНК: 


函数 的 调用 和 返回 操作 。 


call. return 指令 的 关键 字 、 相 关 描 述 以 及 示例 操作 如 下 所 示 。 重 申 一 下 : 
tos 信号 用 于 表示 栈 顶 指针 。STACK [ ] 表示 堆栈 的 内 容 。 


€ Call AAA 
--- 无 条 件 调用 子 函 数 
一 -操作 示例 : 


Tos*—tos +1; 
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STACK [tos] —pc; 
Pe«—AAA 
€ Call c, AAA 
---carry 置 一 时 调用 子 函 数 
一 -操作 示例 : 
If c ==1 then 
Tostos +1; 
STACK [tos] <-pe; 
Pe<—AAA; 
Else 
Ре«—рс +1; 
€ Call nc, ААА 
---carry 置 零 时 调用 子 函 数 
--- 操 作 示 例 : 
If c ==0 then 
Tos<tos +1; 
STACK [tos] «pe; 
Pe«AAA; 
Else 
Pepe +1; 
€ Call 2, AAA 
---zero 置 一 时 调用 子 函 数 
ВЕЛИ: 
If z==1 then 
Tos«—tos +1; 
STACK [tos] —pc; 
Pe<—AAA; 
Else 
Pepe +1; 
€ Call nz, AAA 
— zero HAY Н 7 РЕЖ 
--- 操 作 示 例 : 
If z ==0 then 
Tostos +1; 
STACK [tos] —pc; 
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Рс—ААА; 
Else 
Pec—pe +1; 
€ Return (ret) 
--- 无 条 件 返回 
--- 操 作 示例 : 
pe<STACK [tos] +1; 
tos—tos — 1; 
® Return c (ret c) 
--- 置 一 时 返回 
--- 操 作 示 例 : 
If c =1 then 
pe—STACK [tos] +1; 
tosc—tos – 1; 
Else 
Pe—pce+1; 
€ Return nc (ret nc) 
---carry 置 零 时 返回 
--- 操 作 示 例 : 
If c ==0 then 
pe—STACK [tos] +1; 
tost 一 tos — 1; 
Else 
Pepe +1; 
€ Return z (ret z) 
---zero 置 一 时 返回 
一 -操作 示例 : 
If z ==1 then 
pe—STACK [tos] +1; 
tose—tos – 1; 
Else 
Pepe +1; 
€ Return nz (ret nz) 
---zero 置 零 时 返回 
--- 操 作 示例 : 
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If nz ==0 then 
pe<—STACK [tos] +1; 
tosc-tos — 1; 

Else 
Pe—pce+1; 


15.5.9 ”中断 指 令 


中 断 是 另 一 种 改变 程序 执行 过 程 的 机 制 ， 这 将 会 在 第 18 章 进行 一 个 详细 的 
阐述 。 不 同 于 jump 和 call 指令 ， 它 需要 一 个 外 部 的 请 求 来 触发 。 当 中 断 标志 
激活 并 且 中 断 请 求 被 声明 时 ，PicoBlaze 开始 实施 当前 的 命令 ， 在 声明 /返回 的 栈 
中 保存 下 一 条 指令 的 地 址 ,保存 carry 和 zero 标志 ， 屏 项 中 断 标 识 ， 同 时 将 程序 
计数 器 的 值 设 为 中 断 服务 程序 的 起 始 地 址 3FF。PicoBlaze 有 两 个 中 断 返 回 指令 ， 
用 于 从 中 断 位 置 中 恢复 操作 。 还 有 两 个 指令 用 于 通过 设 定 或 清除 中 断 标 志 来 使 能 
或 者 屏蔽 中 断 请 求 。 这 些 指令 的 关键 字 、 相 关 描 述 以 及 示例 操作 如 下 : 

€ Returni disable( reti disable) 

--- 从 中 断 服务 程序 中 返回 同时 屏蔽 中 断 标 志 位 
-- 示 例 操作 : 
Pe<-STACK[ tos | ; 
Tos«-tos - 1; 
1—0; 


C«—preserved с; 


Z«—preserved z; 
€ Returni enable ( reti enable) 
--- 从 中 断 服务 程序 中 返回 同时 使 能 中 断 标志 位 
--- 示 例 操作 : 
Pe<—STACK[ tos] ; 
Tos—tos - 1; 
I—1; 
C«—preserved c; 
Z«—preserved z; 
€ Enable interrupt( eint) 
--- 使 能 中 断 请 求 
--- 示 例 操作 : 
I—1; 


€ disable interrupt( dint) 
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--- 屏 项 中 断 请 求 

--- 示 例 操作 : 
注意 : 中 断 程 序 中 保存 了 下 一 条 指令 的 地 址 。 当 retumi 指令 被 执行 ， 存 储 在 栈 
顶 ( 即 : STACK[ tos] ) 的 操作 地 址 将 会 被 恢复 。 这 与 一 般 的 return 指令 不 同 ， 通 
常 的 return 指令 是 将 存储 的 地 址 加 一 后 恢复 用 于 操作 (及 STACK[tos] +1)。 


15.6 伪 指 令 声明 指令 


伪 指令 像 是 一 个 汇编 程序 指令 。 虽 然 ， 它 不 是 微 处 理 器 指令 设置 的 一 部 分 ， 
但 其 经 常 有 助 于 程序 开发 。 像 它 名 字 所 描述 的 那样 ， 一 个 伪 指 令 表示 汇编 程序 完 
成 一 个 特定 的 任务 ， 像 定义 一 个 常量 或 者 保留 存储 空间 。KCPSM3 汇编 和 PB- 
lazeIDE 汇编 在 伪 指 令 方面 稍微 有 一 些 不 同 ， 具 体内 容 将 在 下 面 的 模块 中 给 出 。 


15.6.1 KCPSM3 汇编 伪 指令 


在 KCPSM3 汇编 中 主要 伪 指 令 的 关键 字 、 相 关 描 述 和 示例 操作 如 下 : 
€ Address 
一 -这 条 伪 指 令 是 将 特定 的 程序 存储 到 特定 的 ROM 地 址 中 。 
一 例如 : 
Address 3FF 
€ Namereg 
--- 这 条 伪 指令 是 将 一 个 寄存 器 赋予 一 个 符号 名 。 这 将 便于 程序 更 好 的 
描述 。 
一 例如 : 
Namereg s5, index 
® Constant 
--- 这 条 伪 指令 将 一 个 常量 赋予 符号 名 。 这 将 便于 程序 更 好 的 描述 。 
一 -例如 : 


Constant max, FO 
15.6.2 PBlazeIDE 汇编 伪 指 令 


在 PBlazeIDE 汇编 中 主要 伪 指 令 的 关键 字 、 相 关 描述 和 示例 操作 如 下 。 注 
E: $ 符 号 表示 该 数据 用 十 六 进 制 表示 。 
ө Org 
--- 这 条 伪 指 令 详 细 说 明了 后 面 的 程序 代码 存储 到 指令 ROM 的 特定 的 
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地 址 空间 中 ( 即 ,“originate "存储 在 此 地 址 空间 中 ) 。 
Л: 
Org $ ЗЕЕ 
€ Equ 
--- 这 条 伪 指 令 为 一 个 变量 或 寄存 器 设置 一 个 “等 同 ”的 符号 。 它 为 一 
个 常量 或 寄存 器 设 定 一 个 符号 名 。 
一 例如 : 
Max equ 128/8 
Index equ 55 
€ Dsin, dsout, dsio 
--- 这 些 伪 指令 为 LO 端口 的 id 设 定 符号 名 。 相 应 的 端口 可 以 设 定 为 
输入 、 输 出 或 者 双 端 口 信号 。 这 些 指 令 和 equ 之 间 的 区 别 在 于 PB- 
lazeIDE 生成 一 个 “端口 指示 器 "用 于 在 仿真 界面 上 显示 这 些 伪 指 
令 。 在 仿真 过 程 中 这 些 端 口 的 动态 将 会 通过 指示 器 显示 出 来 。 
一 例如 : 
Keyboard dsin $ OE 
Switch dsin $ OF 


Led dsout $ 15 
® Vhdl 
--- 这 条 伪 指令 用 于 生成 一 个 VHDL 类 型 的 ROM。 具 体内 容 将 会 在 第 
16 章 详细 说 明 。 
--- 例 如 : 


Vhdl “template. vhd" , "target. vhd”"”, “ROM” 


15.7 文献 备注 


PicoBlaze 手册 来 自 于 xilinx 公司 的 “PicoBlaze 8-bit 移入 式微 处 理 器 用 户 指 
В, ， 它 提供 了 详细 的 微 处 理 器 信息 ， 包 括 硬件 组 成 、 指 令 设 置 、 开 发 流程 以 及 
KCPSM3 和 PBlazeIDE 汇编 语言 的 描述 。PicoBlaze 公司 的 设计 师 Ken Chapman 在 
“创造 嵌入 式微 处 理 器 ”一 文中 描述 了 此 微 处 理 器 的 来 源 ， 这 在 Xilinx 网 站 的 
TechXclusives 中 是 非常 的 有 用 。 

KCPSM3 汇编 、PicoBlaze HDL 语言 和 指令 ROM 的 HDL 模型 可 以 在 Xilinx 网 
站 中 下 载 。 搜 索 关键 字 “PicoBlaze” 可 以 直接 跳 转 到 下 载 界面 。PBlazeIDE 汇编 语 
言 可 以 到 Mediatronix 的 官方 网 站 http: //www. mediatronix. com 下 载 。 该 网 站 还 提 
供 了 更 多 的 关于 该 软件 的 详细 信息 。 


第 16% PicoBlaze 汇编 语言 开发 


16.1 简介 


因为 其 简易 性 ，PicoBlaze 不 能 有 效 地 支持 高 级 程序 语言 ， 所 以 它 一 般 使 用 
汇编 语言 开发 。 在 这 一 章 ， 我们 提供 了 一 个 由 项 向 下 的 完整 的 开发 流程 。 首 先 我 
们 介绍 数据 处 理 速 率 和 程序 控制 方法 ， 其 次 是 关于 子 程序 的 使 用 ， 最 后 引出 整个 
系统 结构 的 要 点 。 


16.2 有 效 的 代码 段 


PicoBlaze 微 处 理 器 包含 了 字 节 类 型 的 数据 处 理 和 简单 的 条 件 分 支 指令 。 在 
这 一 部 分 ， 我 们 将 举例 说 明 怎 样 构造 代码 去 实现 单 比 特 和 多 字 节 操作 ， 同 时 了 解 
怎样 频繁 调用 高 级 语言 去 实现 控制 。 


16.2.1 KCPSM3 协议 


KCPSM3 汇编 语言 在 设计 中 使 用 如 下 协议 : 
e 程序 中 在 地 址 符 后 使 用 一 个 “:”， 如 “code:”; 
e 在 注释 之 前 使 用 “;”; 
e 为 一 个 常数 加 HH， 表 示 该 数据 为 十 六 进 制 数 据 。 
一 段 示 例 性 的 代码 如 下 : 
; 这 是 一 个 演示 程序 段 
test SO, 82; 150 和 10000010 进行 比较 
jump z, clr-sl; 如 黑 S0 的 最 低位 为 0 ， 程 序 跳 转 到 dr-sf 
load sl, FF; 350], 1111-1111 BAAS! 
clr-sl : 


load sl, 01; 4500000001 #2251 
16.2.2 比特 操作 


PicoBlaze 的 指令 设置 主要 用 于 字 节 型 操作 。 比 特 型 操作 经 常 被 用 于 控制 底 
层 的 VO 端口 操作 ， 比 如 测试 、 设 置 和 清除 1bit 标志 信号 。 
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要 操作 一 个 单 比 特 信号 ， 我 们 首先 要 定义 一 个 掩 码 (ШШ mask) 来 隔离 和 保 


存 无 关 比 特 信号 ， 然 后 在 特定 的 比特 上 执行 特定 的 操作 (BI unmasked) 。 我 们 可 
以 通过 与 合适 掩 码 执行 or, and 和 xor 操作 来 设 定 、 清 除 和 转换 〈 即 转化 ) 数据 
的 一 些 比特 位 。 下 面 的 程序 段 表 示 怎 样 去 设 定 、 清 除 和 转换 寄存 器 s0 的 第 二 个 
低 比 特 位 。 


constant SET-MASK, 02;mask =0000_ 0010 

constant CLR-MASK, FD;mask = 1111 -1101 

constant TOG-MASK, 02; mask = 0000-0010 

or SO, SET-MASK; ZEB — f IEEE TESI 

and SO, CLR-MASK ; 清除 第 二 个 低 比 等 位 

XOT SO, TOG-MASK; # 2 AIR ERE 

以 上 掩 码 隔离 操作 基于 如 下 运算 ,对 于 所 有 的 布尔 型 变量 x, x 多 0 =x , xO 


1 =x'。 同 样 的 法 则 还 可 以 应 用 于 多 比特 数据 转换 。 例 如 ， 我 们 可 以 通过 如 下 操 
作 清 除 高 位 数据 〈 即 ，4 个 高 位 ) 


如 ， 


and s0 ,OF ;mask =0000 1111 

我 们 也 可 以 将 掩 码 的 概念 使 用 到 测试 指令 中 ， 用 来 检测 其 中 的 某 一 位 。 例 
下 面 程序 段 根据 测试 寄存 器 s0 的 高 位 数据 来 确定 程序 跳 转 的 分 支 : 

test SO, 80; mask = 1000 0000 

jump nz, msb-set; 如 果 席 位 为 1 ， 则 跳 转 到 msb-set 分 支 

; LARA 时 程序 执行 分 支 

jump done 

msb-set : 


; DLA EFRI 
done : 


一 个 单独 的 比特 信号 可 以 通过 前 面 的 代码 提取 出 来 。 例 如 ， 下 面 的 程序 段 用 


于 提取 寄存 器 s0 的 高 位 数据 并 将 其 存储 到 寄存 器 sl 中 : 


Load sl ，00 

test S0, 80 ; mask = 1000-0000 ,提取 高 位 
jump z, done ; ПЕЙ, Kies 

load sl, 01 ; BIR, #601 WASI 


done: 
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16.2.3 多 字 节 数据 处 理 


一 个 微 处 理 器 有 时 候 需 要 处 理 大 量 的 多 字 贡 数据 ， 比 如 一 个 大 的 计数 器 。 当 
PicoBlaze 的 数据 位 宽 为 8bit 时 ， 处 理 此 类 数据 需要 一 个 在 两 个 连续 指令 中 传递 
信息 的 机 制 。PicoBlaze 使 用 进位 标志 来 达到 这 个 目的 。 对 于 算术 指令 ， 它 们 将 
加 和 减 译 为 一 个 需要 进位 一 个 不 需要 进位 ， 就 像 add 和 addcy 命令 一 样 。 对 于 移 
动 和 翻转 指令 ， 进 位 被 移 到 一 个 寄存 器 的 高 位 或 者 低位 ， 反 之 亦 然 。 

Wt x Al y 均 为 24bit 的 数据 ， 故 它们 都 需要 占用 3 个 寄存 器 。 下 面 的 程序 段 
说 明了 多 字 节 数据 相 加 过 程 中 进位 信和 号 的 使 用 方法 : 

namereg sO, x0; x MACHA F h 

namereg sl, xl; x APH FT 

namereg s2, x2; x Hi RA 

namereg s3, yO; y MAMMAL h 

namereg 54, yl; y MP] Fi 

namereg s5, y2; y Maem fu 1 

;add: (x2, xl, x0) + (y2, yl, уб) 

add x0, yO; ff 13 Hl 

addey xl, yl; 带 有 进位 的 中 间 字 节 相 加 

addey x2, y2; 带 有 进 伺 的 最 高 位 字 节 相 加 

第 一 条 指令 实现 最 低位 字 节 相 加 并 将 进位 值 存储 到 进位 标志 中 。 第 二 条 指令 
将 包含 有 进位 标志 的 中 间 字 节 相 加 。 同 样 的 ， 第 三 条 指令 使 用 先前 相 加 所 得 到 的 
带 有 进位 标志 的 结果 与 最 高 位 字 节 相 加 。 

多 字 节 的 加 减法 可 以 通过 类 似 的 方式 实现 : 

; increment; (x2, xl, x0) +1 

add х0, 01; Jeff RIM 

адасу xl, 00; 9/8] 17 #0 

адасу x2, 00; 0758717 ЖАЛП 

; subtract; (x2, xl, x0) - (y2, yl, y0) 

sub х0, yO; REEF T THO 

subcy xl, x: SEHE TER PE F TS ka 

subey x2, y2; 带 借 位 的 最 高 字 节 相 减 

多 字 节 数据 转换 可 以 通过 包含 进位 标志 的 单独 的 移 位 运算 指令 实现 。 例 如 ， 
sla 指令 是 将 数据 左 移 一 位 并 将 进位 移动 到 该 数据 的 最 低位 。 实 现 3 字 节 数据 左 
移 的 程序 如 下 所 示 : 

; shift (x2 , xl , x0 ) via carry 
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510 x0; 将 x0 的 低位 补 零 ， 最 高 位 移 到 进位 中 
sla х1; 将 xl 的 进位 移 到 最 低位 ， 最 高 位 移 到 进位 中 
sla х2; х2 的 进位 移 到 最 低位 ， 最 高 化 移 到 进化 中 


16.2.4 控制 结构 


一 种 高 级 语言 通常 包含 各 种 各 样 的 控制 结构 去 改变 程序 执行 的 顺序 。 这 包括 
if-else 语句 、case 语句 和 for 循环 语句 。 男 一 方面 ，PicoBlaze 只 提供 有 条 件 和 无 
条 件 调转 指令 。 尽 管 指令 简单 ， 我 们 可 以 通过 它们 和 test 或 compare 指令 一 起 去 
实现 高 层次 的 控制 结构 。 下 面 的 例子 说 明了 if-else 语句 、case 语句 和 for 循环 语 
句 的 构造 。 

首先 我 们 介绍 if-else 语句 : 

if( s0 — sl) | 

/ жеп 分 支 状态 */ 
| 
else | 

/ xelse 分 支 状态 ж/ 
| 

相应 的 汇编 代码 段 如 下 : 

compare sO, sl 


jump nz, else-branch 


; then 分 支 的 代码 


jump if-done 
else-branch ; - 


; else 分 支 的 代码 


if-done: 
; 恕 黑 状 态 有 将 执行 下 面 代 码 


程序 中 使 用 compare 指令 去 检查 条 件 80 == sl 和 设 定 zero 标志 。 下 面 的 jump 
指令 检查 相应 的 判定 标志 是 否 为 0 来 确定 程序 是 否 跳 转 到 else 分 支 。 
Case 结构 可 以 看 作 是 一 个 多 路 跳 转 ， 这 个 结构 的 跳 转 取 决 于 条 件 表达 式 的 
值 。 下 面 的 程序 中 将 变量 s0 作为 表达 式 并 跳 转 到 相应 的 分 支 ; 
switch (50) | 


case valuel: 
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/ *valuel 状态 有 时 程 序 执行 的 操作 */ 
break; 
case value2 ; 
/ жуаше2 状态 时 程序 执行 的 操作 */ 
break; 
case value3 : 
/ *value3 状态 时 程序 执行 的 操作 */ 
break; 
default: 
/ *default 状态 时 程序 执行 的 操作 »/ 
| 
一 些 处 理 器 的 多 路 跳 转 可 以 通过 一 种 “地 址 索引 模式 ”的 硬件 特性 实现 。 然 
而 ，PicoBlaze 不 支持 这 种 特性 ， 所 以 case 指令 不 得 不 被 看 作 一 个 if-else 序列 。 换 
名 话说， 前 面 的 case 语句 可 以 看 作 如 下 操作 : 
if (s0 ==valuel ) | 
/ *valuel 状态 时 程序 执行 的 操作 */ 
| f 
elseif( 50 == value2 ) | 
/ *value2 状态 时 程序 执行 的 操作 */ 
| 
elseif( 50 == value3 ) | 
/ *value3 状态 有 时 程 序 执行 的 操作 */ 
| 
else( 
/ «default 状态 有 时 程序 执行 的 操作 */ 
| 
相应 的 汇编 语言 代码 段 变 为 
constant valuel , 
constant value2 , 
constant value3 , 
compare SO, valuel; 测试 valuel 
jump nz, case 2; 与 valuel fA AAS, MBE 
; casel 状态 的 代码 
jump case-done 


case 2: 
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compare SO, value2; 测试 value2 

jump nz, case 3; 与 value2 (A AAAS, WEKE 
; case2 状态 的 代码 

jump case _ done 

case 3; 

compare SO, value3; jit value3 

jump default; 与 value3 (RAIA, ДЇЙНЄ 

; case3 状态 的 代码 


jump case _ done 
default ; 


; default [ff 5 


case done : 


; case І] РТА 


For 循环 语句 是 重复 执行 一 段 程序 代码 。 程 序 通过 计数 器 的 值 来 追踪 循环 执 
行 的 次 数 。 具 体 示 例如 下 所 示 : 
Еог(1 = MAX, 1-0, I-1)| 


/ {Ж */ 
| 
汇编 语言 程序 段 如 下 : 
namereg s0, i ; MARIA 
constant MAX, . .. ; BAIA 
load i, MAX; А5116 
loop-body : 
; 循环 体 代 码 
sub i, 01 ; AAS А7 


jump nz, loop-body; done? 


: 下 面 是 循环 执行 的 代码 


316% PicoBlaze 汇编 语言 开发 : 449 - 





16.3 FEFFE 


一 个 子 程序 , 像 C 语言 中 的 一 个 函数 ， 实 现 一 个 庞大 设计 的 一 部 分 功能 。 
它 用 于 实现 特定 的 功能 并 且 可 以 重复 使 用 。 使 用 子 程序 允许 我 们 方便 地 将 一 个 设 
计 分 为 若干 个 小 的 模块 ， UN 
性 。 这 是 一 种 基于 先进 设计 理念 的 设计 方法 ， 同 时 它 支 持 高 级 语言 的 开发 。 

PicoBlaze 使 用 call 和 return 指令 去 实现 子 程序 调用 。Call 指令 保存 当前 程序 
计数 器 的 内 容 并 将 进程 跳 转 到 子 程序 的 起 始 地 址 中 。 一 个 子 程序 通过 return 指令 
结束 ， 它 用 于 恢复 保存 在 程序 计数 器 的 值 并 继续 先前 的 操作 。 一 个 典型 的 流程 图 
见 图 15-7。 说 明 : PicoBlaze 只 有 在 函数 调用 和 返回 的 时 候 才 会 保存 和 恢复 程序 
计数 器 的 值 。 我 们 不 得 不 手动 管理 寄存 器 和 数据 RAM 来 保证 在 子 函数 执行 完成 
后 原 系统 中 这 些 数 据 不 会 发 生 改 变 。 

下 面 这 个 乘法 的 例子 说 明了 一 个 子 程序 的 开发 过 程 。 我 们 设 输入 为 两 个 8bit 
的 无 符号 整形 数据 ， 输 出 为 一 个 16bit 数据 。 运 算法 则 基于 简单 的 shift-and-add 
方法 。 这 种 方法 是 反复 通过 一 个 8bit 的 乘法 器 。 在 每 次 循环 中 ， 被 乘 数 左 移 一 个 
位 置 。 如 果 相 应 的 乘 数 为 1， 将 转换 后 的 被 乘 数 加 到 运算 结果 中 。 汇 编程 序 见 示 
例 16. 1。 被 乘 数 和 乘 数 分 别 被 存储 到 寄存 器 s3 和 54 中 。 单 比特 的 乘法 通过 重复 
右 移 s4 得 到 ， 它 将 进位 值 移 到 数据 的 最 低位 。 说 明 : 和 左 移 被 乘 数 不 同 ， 我 们 
将 分 别 存储 于 寄存 器 ss 和 s6 的 由 两 个 字 节 组 成 的 运算 结果 右 移 。 

示例 16. 1 软件 整数 乘法 


程序 : 乘法 软件 

作用 : 8bit FFF FATE Me H] shift-and-add 运算 法 则 
f A BFF an: 

s3 : MORE 

54: ЖЕЖ 

Mini EE: 

s5: HARE TM 

s6: ARASH 

[ЖН] AAA: i 


mult-sof t: 


load s5, 00 ; 清除 s5 
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load i，08 ; 初始 化 循环 索引 值 
mult-loop: 
sr0 s4 ; 将 最 低位 移 到 进位 中 
jump nc, shift-prod ; RMA AO 
add s5, s3 ; RAREN] 
shift-prod : 
sras5 ; 右 移 高 位 字 节 
; 进 伺 移 到 最 高 位 ， 最 低 伺 移 到 进 亿 中 
sras6 ПЕЛ TE 
; 55 ВКТ тб 的 高 位 
sub i, 01 ; ARTI B W 
jump nz, mult-loop ; 反复 执行 直至 i =0 


return 


由 于 汇编 语言 本 身 的 特性 ， 汇 编 语 言 的 编程 描述 十 分 接近 于 底层 元 器 件 。 一 
个 子 程序 需要 包含 一 个 描述 性 的 头 文件 和 详细 的 注释 。 典 型 的 头 文件 在 示例 
16. 1 具体 说 明 。 它 由 一 个 简短 的 功能 描述 和 有 效 的 寄存 器 组 组 成 。 后 面 将 会 介 
绍 在 一 个 大 的 设计 中 寄存 器 如 何 分 配 以 及 如 何 避 免 关键 寄存 器 冲突 。 


16.4 编程 


汇编 语言 Fi 言 程序 的 编写 步骤 如 下 : 
1) 编写 主 程序 的 伪 代 码 ; 
2) 分 析 主 程序 中 包含 的 各 任务 ， 提 取出 来 作为 子 程序 。 如 果 有 必要 ， 可 将 
复杂 子 程序 进一步 分 解 ; 
3) 确定 寄存 器 和 RAM 的 使 用 ; 
4) 编写 各 子 程序 的 源 代码 。 
步骤 1、2 和 4 主要 采用 了 “化 整 为 零 ， 各 个 击破 ”的 方法 ,该 方法 适用 于 
任何 软件 程序 的 编写 。 微 控制 器 一 般 应 用 于 简单 的 做 入 式 系统 中 ， 在 该 系统 中 处 
理 器 不 断 地 监控 VO 接口 并 对 其 做 出 响应 。 它 的 主 程序 一 般 有 如 下 结构 : 
call initialization_routine 
forever: 
call taskl routine 
call task2 routine 
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call taskn routine 
jump forever 
Ж 3). 是 汇编 语言 编程 区 别 于 高 级 语言 而 特有 的 。 用 高 级 语言 编程 时 ， 编 
译 器 会 自动 地 为 变量 分 配 存储 单元 ， 而 用 汇编 语言 编程 时 ， 我 们 必须 人 工分 配 好 
数据 存储 单元 。PicoBlaze 有 16 位 的 寄存 器 和 64 字 节 的 数据 КАМ 用 来 存储 数据 。 
寄存 器 可 看 作 快 速 存储 单元 ， 能 直接 对 其 内 部 数据 进行 操作 。 与 之 相对 ， 数 据 
RAM 是 “辅助 ”存储 单元 ， 其 内 数据 需要 转移 到 寄存 器 才能 被 处 理 。 例 如 ， 如 
果 我 们 想 为 RAM 中 的 某 一 数据 增加 一 个 条 目 ， 必 须 首 先 将 其 移 到 一 个 寄存 器 
中 ， 增 加 完成 之 后 再 移 回 到 RAM 中 。 
数据 RAM 的 使 用 在 数据 存储 速率 方面 受到 限制 ， 这 是 需要 提前 考虑 的 因 
素 ， 尤 其 是 在 代码 较 复 杂 且 包含 嵌 套 子 程序 的 情况 下 。 为 了 有 助 于 编码 ， 我 们 可 
以 首先 定义 所 需 的 全 局 存储 单元 或 局 部 存储 单元 。 前 者 存储 整个 程序 用 到 的 数 
据 ， 后 者 为 中 间 结 果 提 供 存储 空间 ， 相 关 运算 结束 后 这 部 分 空间 得 到 释放 。 


16.4.1 示例 


这 个 过 程 用 一 个 例子 来 说 明 。 让 我 们 考虑 一 个 程序 ， 它 用 到 前 面 的 乘法 子 程 
序 。 它 首先 从 转换 器 读 入 两 个 数据 a 和 b， 然 后 计算 а + 6 ， 并 将 结果 显示 在 8 
个 离散 的 LED 上 。 因 为 IO 接口 将 在 第 17 章 讲解 ， 现 我 们 仅 将 8bit 的 转换 器 看 
作 一 个 输入 端 ， 将 8bit LED 看 作 输 出 端 。 我 们 假设 a 和 4 分 别 从 转换 器 的 高 4 位 
和 低 4 位 获取 。 主 程序 如 下 : 
call clear-data-ram 
forever : 
call read-switch 
call square 
call write-led 
jump forever 
子 程序 定义 如 下 : 
€ clr data mem: 系统 初始 化 时 清除 数据 存储 器 ; 
€ read-switch: 获取 转换 器 高 4 位 和 低 4 位 数据 ， 将 值 存 人 数据 RAM; 
ө square; 运用 乘积 子 程序 计算 a^ +b; 
€ write-led: 将 运算 结果 的 低 8 位 写 入 到 LED 端 。 
为 了 实现 该 示例 的 功能 ， 在 read-switch 子 程序 中 我 们 设计 两 个 小 程序 get _ 
upper nibble 和 get. lower nibble 来 获取 数据 高 4 位 和 数据 低 4 位 。 
实现 过 程 的 第 二 步 是 分 配 寄存 器 和 数据 RAM。 我 们 为 全 局 变量 存储 单元 引 
人 一 个 全 局 寄存 器 sw_in 来 存储 从 转换 器 读 和 的 数据 ， 并 且 分 配 11 字 节 的 数据 
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RAM 存储 square 子 程序 的 输入 和 结果 数据 。 数 据 RAM 的 分 配 如 图 16-1 所 示 。 
注意 地 址 01 和 03 实际 上 并 未 使 用 。 它 们 被 保留 00 [ 低 四 位 a 
用 来 简化 7 段 式 LED 显示 代码 (相关 内 容 将 在 第 ©! 
17 章 进行 详细 讲解 ) 。 所 有 剩余 的 寄存 器 被 用 作 。 2 
局 部 存储 器 。 为 使 编程 更 清晰 ， 我 们 定义 3 个 信 о 
号 名 称 data, addr 和 i 作为 data. port and memory 05 | ! : 
address 和 loop index 的 临时 寄存 器 。 

最 后 一 步 是 实现 子 程序 的 汇编 语言 编码 。 全 о 
部 的 源 代码 见 示例 16.2, сіг data mem 子 程序 用 09 
一 个 循环 控制 来 清空 数据 存储 区 。 寄 存 器 i 内 是 0А 
循环 指针 ， 初 始 化 为 64 〈40H) 。 循 环 指针 依循 ”图 16-1 数据 КАМ 存储 器 分 配 
环 次 数 递 减 ， 且 0 分 配给 了 相应 的 数据 RAM 地 
lb. write led 程序 从 数据 RAM 中 读 取 计算 结果 的 低 8 位 并 输出 给 LED 端 。 

子 程序 read-switch 包含 两 个 小 程序 ，get upper nibble 子 程序 用 来 将 data 寄 
存 器 内 的 值 右 移 4 位 以 将 高 4 位 移 至 低 4 位 。get_lower_nibble 子 程序 将 高 4 位 清 
为 0 用 以 移 走高 位 数据 。read-switch 程序 的 “glue instructions” 用 来 输入 转换 器 
数值 ， 提 供 高 4 位 和 低 4 位 数据 处 理子 程序 的 输入 ， 并 且 将 结果 存 人 数据 RAM。 

子 程序 square 从 数据 RAM 中 取 走 数据 ， 利 用 mult. soft 子 程序 计算 ЖЬ", 
求 和 ， 并 且 将 计算 结果 存 回 数据 RAM, 

示例 16.2 具有 简单 高 四 位 和 低 四 位 输入 的 平方 程序 


未 使 用 





s-a (H4 fz) ЖЬ (W4 17) KIEF Mhr 
;- 计算 a жа+Ь *b 
;- 在 8 个 LED 上 显示 数据 


, 
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constant a lsb, 00 
constant b lsb, 02 
constant аа lsb, 04 
constant aa msb, 05 
constant bb lsb, 06 
constant bb msb, 07 
constant aabb lsb, 08 
constant aabb msb, 09 
constant aabb cout, OA 


; 通用 的 局 部 变量 

namereg s0, data ; 临时 数据 寄存 于 

namereg sl , addr ; 上 临时 储存 天 与 IO a OHA AR 
namereg s2,i ; ABATE ET 

; 全 局 变量 

namereg sf, sw in 


—M AA EL С 
constant sw port, 01;8-bit switches 


р ваннай SEL ——————— 
constant led port, 05 


main 

; -clr data mem 

; -read switch 

; -get trpper nibble 


; -get lower nibble 
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; -square 
; -mult soft 


;  -write led 


call clr data mem 
forever; 

call read switch 

call square 

call write led 

jump forever 


; 程序 : clr data mem 
功能 : 清除 数据 存储 带 


临时 寄存 器 : data, i 


- 


clr data тет: 
load i, 40 ; #J/ñ k IEERISEI 64 
load data, 00 

clr mem loop: 
store data, (i) 
sub i, 01 ; WA Ss E ED 
jump nz, clr mem loop ; 重复 执行 直到 i =0 
return 

程序 : read_switch 

; ”功能 : 从 输入 得 到 高 四 位 和 做 四 位 

MATA: sw in 

Il] # 4788 ; data 


- 


- 


РТ 


read switch ; 
input sw in, sw port ; ЕЛДЕ A 
load data, sw in 
call get lower nibble 
store data, a lsb ; Жа 存 人 数据 R4M 中 


load data, sw_in 
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call get upper nibble 
store data, b 15Ь ; 将 b 存 人 数据 RAM 中 
程序 : get lower nibble 
功能 : 得 到 数据 低 四 伺 
Л АГ : data 
Jii iti PY FF ax: data 


get lower nibble: 


and data, UP NIBBLE MASK ; УЕ 
return 


程序 : get upper. nibble 


; he: 得 到 数据 高 四 位 
ЛАТ: data 
; fii AY re: data 
get upper nibble: 
sr0 data ; 向 右 移 位 4 次 
sr0 data 
srÜ data 
srÜ data 
return 


ЖЕ: write-led 


; 功能: 将 结 内 的 低 八 位 输出 给 8 个 LED 
; 临时 АМЕ: data 
write-led : 
fetch data, aabb lsb 
output data, led port 
return 
; 程序 : square 


功能 : 计算 a жа+Ь *b 
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将 数据 /结果 存储 在 RAM 中 
ПАРТЕ: s3 , 54,55, 56, data 


square 
; 计算 a *a 
fetch s3, a_Isb ; Mga 
fetch s4, a_Isb ; 1а 
call mult soft ; 计算 a жа 
store 5б, aa_Isb ; 存储 a жа ЖИЕ 
store s5, aa msb ; Йа жа WF 
; 计算 b *b 
fetch 53, b_ lsb ; Jill b 
fetch s4, b lsb ; ШЖ b 
call mult soft ; 计算 b *b 
store s6, bb lsb ; lb «b HEET 
store 55, 07 ЖЬ xb gg 
; 计算 a *a+b *b 
fetch data, aa_lsb ; 得 到 a «a BMICEE ЧТ 
add data, s6 ; Жа xa Alb *Ь 的 低 字 节 相 加 


store data, aabb lsb ; фа *a +b xb HEZE 
fetch data, aa msb ; 得 到 a «a ЮЕ 


addcy data, s5 ; Жа xa ЖЬ *b WRF E" 
store data, aabb msb ; а *a +b *b 的 高 字 

load data, 00 ; 清除 数据 ， BERETE 
addcy data, 00 ; 从 前 面 的 操作 中 得 到 进位 输出 
store data, aabb cout ; 存储 a *a +b b 的 进位 输出 
return 


; 程序 : muit soft 
功能 : НЕТА ER Sbit HGRA 
ЛР: 
83; ЯЕ 
sd; FER 
ЖИН FF te : 
s5: GRAFT 
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$056: BRIE Y 


з M EE EIU 
mult soft : 
load s5, 00 ; HER SS 
load i, 08 ; MEME He ET 
mult loop: 
srÜ 54 ; 将 最 低位 移 位 至 进位 
jump nc, shift prod ; ОИУ 420 
add 55, 53 ; 最 低位 是 1 
shift prod: 
Sra 55 ; KATHAH, 
; 进位 移 至 最 高 位 ， 最 低位 移 至 进位 
sra 56 EHE TAE, 
; 将 s5 的 最 低位 移 至 s6 的 最 高 位 
sub i, 01 ; MATE EE mk 
jump nz, mult loop ; 重复 直到 i =0 
return 


16.4.2 程序 文件 


汇编 语言 程序 的 编写 是 一 个 单调 乏味 的 过 程 。 标 识 符 的 使 用 和 好 的 注释 文本 
可 使 代码 清晰 并 能 减少 很 多 不 必要 的 错误 ， 并 且 有 助 于 后 续 校 对 和 维护 。 对 于 
KCPSM3 汇编 语言 ， 我 们 可 以 使 用 constant 命令 定义 一 个 标识 符 来 代表 常量 、 存 
储 地 址 或 端口 id， 使 用 namereg 命令 定义 寄存 器 变量 标识 符 。 

示例 16.2 列 出 了 一 个 典型 的 主 程序 文件 头 ， 它 包含 以 下 几 部 分 : 

e@ 程 序 概述 : 概括 描述 程序 要 实现 的 功能 、 实 现 方式 和 IO( 输 入 输出 ) 端 口 ; 

e 常 量 声明 : 声明 程序 定义 的 符号 常量 ; 

e 数 据 RAM 地 址 标识 : 声明 程序 定义 的 RAM 地 址 标识 符 ; 

e 寄存 器 定义 : 声明 程序 定义 的 寄存 器 标识 符 ; 

e 端口 定义 : 声明 程序 定义 的 端口 ; 

e 程序 调用 层次 说 明 : 阐明 程序 调用 关系 和 子 程序 功能 。 

这 些 标识 符 和 命令 对 最 终 的 机 器 语言 代码 没有 任何 影响 ， 在 汇编 语言 代码 进 
行 编译 时 它们 被 实际 所 指 代 的 常量 值 蔡 换 。 然 而 使 用 标识 符 能 极 大 地 提高 汇编 代 
码 的 可 读 性 ， 减 少 不 必 要 的 错误 。 下 面 的 这 段 代 码 进一步 前 述 了 标识 符 和 注释 文 
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本 的 影响 。 这 段 代码 的 目的 是 为 变量 a、b Alc 赋值 ， 并 将 它们 存储 到 数据 RAM 
相应 的 位 置 。 存 储 地 址 由 UART 的 输入 ， 即 字母 a、b 或 c 的 ASCII 码 指定 。 下 
段 代码 使 用 了 标识 符 和 适当 的 注释 : 
; 常量 别名 
constant ASCII a, 61 ; a AYASCI 45 
constant ASCII b, 62 ; b ŘJ ASCII #3 
constant ASCII с, 63 ; c AYASCI fij 
; 数据 RAM НАЕ 
constant а addr, 02 
constant b addr, 04 
constant c addr, 06 
СЕЛА 
namereg sO, data ; ШЛИ 
namereg sl, addr ; M aL S 
namereg sF, sw in ; EMR A 
; 端口 市 名 
constant sw port, 01 ; PHASE BA 
constant uart rx port, 02 ; UART 输入 


; 带 有 别名 的 汇编 码 
; 得 到 输入 
input sw in, sw port ; PEERS 
input data, uart rx port ; 得 到 字符 
; 检查 收 到 的 字符 
compare data, ASCII a ; ff ASCII a 


jump nz, chk ascii b ; HR, ЮА F— 
Store sw in, a addr ; EM, Жа 存 人 数据 R4M 中 


jump done 
chk ascii b; 
compare data, ASCII_b ; Bf ASCII b 
jump nz, chk ascii c ; FR, MART 
store sw in, b addr Е, ЖЬ FAH RAM 中 
jump done 


chk ascii c ; 
compare data, ASCII c ; KA ASCII c 
jump nz, ascii err ; 错误 
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store sw in, c addr ; JEW, Jb Т ЛЖ КАМ 中 
jump done 


ascii err : 
done ; 


如 果 我 们 使 用 实际 数值 并 且 去 掉 注 释 ， 代 码 变 为 
; RAW RIPE FERT ЇЗ 
input sf, 01 
input 50, 02 
compare SO, 61 
jump nz, addrl 
store sf, 02 
jump  addr4 
addrl ; 
compare 50, 62 
jump nz, addr2 
store sf, 04 
jump  addr4 
addr2 : 
compare S0, 63 
jump nz, addr3 
store sf , 06 
jump  addr4 
addr3 . 


addr4 Н 


尽管 这 段 代 码 与 前 述 代 码 的 功能 是 一 样 的 ， 但 是 对 于 理解 、 调 试 和 修改 来 说 - 
相当 困难 。 


16.5 汇编 代码 处 理 


PicoBlaze-based 设计 流程 在 15. 4 节 进 行 了 回顾 。 汇 编 代 码 设计 完成 后 ， 经 
过 步 又 3， 代 码 进行 编译 转换 为 机 器 指令 。 在 步骤 4 中 ， 指 令 级 别 的 仿真 也 能 验 
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证 代码 的 正确 性 。 在 本 章节 对 这 两 个 步骤 及 直接 下 载 过 程 (25289) 进行 详细 的 
论述 讲解 。 Р 

Xilinx 为 步骤 3 中 的 编译 过 程 提供 了 编译 器 KCPSM3 ， 并 且 为 步骤 9 提供 了 
下 载 应 用 程序 。 用 户 可 以 从 Xilinx 网 站 下 载 源 程序 、PicoBlaze 处 理 器 的 HDL 代 
码 和 相关 的 文档 模板 。Mediatronix 公司 提供 的 PBlazeIDE 程序 可 进行 步骤 4 中 的 
指令 级 别 仿真 ， 也 可 被 用 作 编 译 器 。 用 户 可 从 Mediatronix 的 网 站 下 载 PBlazeIDE 
软件 。 


16.5.1 KCSPM3 编译 


编译 软件 将 代码 指令 翻译 为 只 有 0 和 1 的 机 器 指令 ， 并 且 用 实际 值 蔡 换 标识 
符 和 分 支 地 址 代号 ， 机 器 指令 然后 被 下 载 到 微 处 理 器 的 指令 存储 器 。 因 PicoB- 
laze 嵌入 到 FPGA 内 部 ， 指 令 存储 ROM 实际 成 为 了 一 个 存储 编译 后 代码 的 HDL 
ROM 模块 。 此 ROM 将 在 顶层 HDL 代码 、PicoBlaze 综合 和 IO 端口 电路 中 进行 
示例 说 明 。 

Xilinx 提供 了 KCPSM3 编译 器 ， 它 是 一 个 在 DOS 环境 下 运行 、 使 用 命令 行进 
行 操作 的 软件 。KCPSM3 基本 上 采用 汇编 程序 ， 同 时 提供 必要 的 模板 文件 ， 并 生 
成 针对 所 述 指令 ROM 中 的 HDL 代码 。 编 译 一 个 汇编 代码 的 过 程 如 下 : 

1) 创建 一 个 工程 目录 ， 并 且 将 kepsm3. exe, ROM form. vhd, ROM form. v 和 
ROM form. coe 文件 复制 到 目录 下 ， 后 3 个 文件 为 KCPSM3 的 模板 文件 。 

2) 创建 汇编 程序 并 保存 为 扩展 名 为 рэт 的 文本 文件 ， 任 何 基 于 PC 的 编辑 
fit, ИП Notepad ， 均 能 用 来 完成 此 任务 ; 

3) 调用 DOS 命令 窗口 : 选择 “开始 ”一 “程序 ”一 附件 一 命令 提示 符 ， 
在 DOS 命令 窗口 中 ， 进 入 到 工程 目录 下 ; 

4) 输入 kcpsm3 myfile. pm 命令 运行 程序 ; 

5) 如 果 有 语法 错误 ， 改 正 并 重新 编译 ; 

6) 编译 成 功 后 ,文件 会 包含 指令 ROM, myfile. v 文件 生成 。 

除 HDL 文件 之 外 ，KCPSM3 还 产生 了 用 于 block RAM 初始 化 等 功能 的 文件 。 
扩展 名 为 . hex 的 文件 用 于 JTAG 下 载 ， 在 16. 5. 3 节 将 对 此 做 进一步 论述 。 扩 展 
名 为 . fmt 的 文件 为 . psm 文件 的 重 定格 式 ， 用 于 打印 。 


16. 5.2 PBlazeIDE 仿真 


正如 名 字 所 示 ， 指 令 级 仿真 指 按 指令 一 条 条 执行 来 模拟 PicoBlaze 系统 的 操 
作 。PBlazeIDE 软件 可 用 于 实现 此 功能 。PBlazeIDE 是 一 个 Windows 操作 系统 下 的 
综合 开发 环境 ， 包 含 文本 编辑 器 、 编 译 器 和 指令 级 仿真 器 。PBlazeIDE 使 用 的 指 
令 在 存储 方式 和 说 明 中 有 一 些 差异 ， 详 细 情 况 已 在 15. 5 节 进 行 了 论述 。 这 样 ， 
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JH KCPSM3 软件 编写 的 代码 并 不 能 直接 用 于 PBlazeIDE ， 存 储 方式 的 差异 在 表 16- 
1 中 进行 了 总 结 ， 命 令 的 差异 在 表 16-2 中 进行 了 总 结 。 值 得 注意 的 是 ，PBlazeLI- 
DE 编译 器 中 常量 对 于 十 进 制 和 十 六 进 制 格式 均 支 持 ， 十 六 进 制 数据 以 $ 符号 开 
3k, W$ 1A, 


Ж 16-1 KCPSM3 ЯП PBlazeIDE 存储 方式 的 差异 


















KCPSM3 PBlazeIDE KCPSM3 PBlazeIDE 
addcy adde output sX, (sY) out sX, sY 
subcy sube output sX, KK out sX, $ KK 

compare comp return ret 

store sX, (sY) store sX, sY returni reti 
fetch sX, (sY) fetch sX, sY enable interrupt eint 
input sX, (sY) in sX, sY disable interrupt dint 
input sX, KK insX, $ KK 








Ж 16-2 KCPSM3 ЯП PBlazeIDE 指令 举例 


















功能 KCPSM3 PBlazeIDE 
代码 位 置 address 3FF org $ 3FF 
常量 constant MAX, 3F MAX equ $3F 
寄存 器 别名 namereg addr, s2 addr equ s2 
constant in port, 00 in. port dsin $ 00 
constant out. port, 10 out port dsout $ 10 
constant bi port, OF bi port dsio $ OF 





KCPSM3 代码 用 于 PBlazeIDE 软件 仿真 的 过 程 如 下 : 

1) 用 KCPSM3 编译 汇编 语言 代码 ; 

2) 运行 PBlazeIDE ; 

3) 选择 “Settings” 一 “PicoBlaze 3”， 此 操作 指定 PicoBlaze 使 用 的 为 版 本 
3，Spartan-3 使 用 的 为 该 版 本 ; 

4) 选择 “Pile” 一 “Import”， 跳 出 一 个 对 话 框 ， 选 择 相应 的 .fmt 文件 ， 
“Import” 选 项 的 作用 是 将 KCPSM3 代码 转换 为 PBlazeIDE 代码 ， 格 式 转换 程序 应 
用 非常 简单 ， 但 转换 后 的 文件 有 时 还 需要 一 些小 的 手动 辅修 。 

5) 手动 设 定 dsin, dsout 和 dsio 命令 设置 VO 端口 ， 当 这 些 命令 中 的 任 一 个 
被 使 用 时 ， 一 个 端口 指示 器 将 被 添加 到 仿真 屏幕 显示 这 个 端口 的 行为 ; 

6) 进入 仿真 模式 ， 选 择 “Simulate” 一 “Simulate” 执行 仿真 。 
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7) 如 果 汇 编 代 码 需要 修改 ， 只 能 在 PBlazeIDE 外 部 完成 ， 关 闭 当 前 文件 ， 
调用 外 部 编辑 器 编辑 原始 的 . рет 文件 ， 保 存 ， 然 后 从 步骤 1 重新 开始 。 如 果 文 
件 在 PBlazeIDE 内 进行 了 编辑 ， 能 逆转 换 到 KCPSM3 代码 。 

典型 的 仿真 截图 见 图 16-2 ， 仿 真 器 在 中 间 窗 口 显示 汇编 代码 ， 高 亮 显示 即将 
执行 的 下 一 条 指令 。 指 令 地 址 、 指 令 代 码 和 断 点 被 显示 到 代码 旁 侧 。PicoBlaze 
目前 将 其 显示 在 左 侧 ， 包 含 flag 状态 、 寄 存 器 的 内 容 和 data RAM 的 内 容 。 程 序 
计数 器 的 值 和 堆栈 指针 以 及 一 些 执行 状态 统计 表 显 示 在 底 栏 。 





аы | оша, 
4 а sse po 


768413210 


D UOCCODOOCOXCROQO. 
D OGOQODOODODOGOQO. 
7 SSABCDEF 


指令 代码 ”已 执行 的 指令 数 执行 时 间 І 当前 堆栈 值 


图 16-2. PBlazeIDE 仿真 截图 


由 dsin dsout 和 dsio 命令 产生 的 LO 端口 显示 在 右 侧 。 有 一 个 输入 端口 、 
转换 器 、 输 出 端口 、LED 在 目前 的 这 个 屏幕 上 。 由 于 PBlazeIDE 无 1⁄0 行为 信 
息 ， 在 仿真 中 输入 端口 数据 必须 手动 输入 和 更 改 。 

仿真 中 ， 汇 编程 序 执行 方式 有 连续 执行 、 按 指令 步 步 执行 、 执 行 到 断 点 处 暂 
停 等 执行 方式 。 仿 真 方式 可 通过 Simulate 菜单 命令 或 顶部 图 标 选 项 进行 控制 : 

ө Reset: 清除 程序 计数 器 和 堆栈 指针 ; 

e Run: 连续 运行 程序 至 断 点 处 ; 

€ Single step: 执行 一 条 指令 ; 
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€ Step over; 全 部 执行 ， 有 一 个 调用 指令 及 执行 整个 子 程序 ; 
€ Run to cursor; 执行 程序 到 目前 的 指针 位 置 ; 

€ Pause; 暂停 仿真 ; 

€ Toggle breakpoint: 在 目前 的 指针 位 置 设置 或 清除 断 点 ; 

€ Remove all breakpoints; 清除 所 有 上 断 点 。 


16.5.3 JTAG 重 载 


指令 ROM HDL 代码 产生 之 后 ， 我 们 可 以 继续 15. 4 节 所 述 的 步骤 6 和 8， 综 
合 全 部 代码 并 下 载 配置 文件 到 FPGA 芯片 。 值 得 注意 的 是 ， 每 次 代码 修改 后 综合 
码 流 必须 重新 下 载 。 

由 于 综合 是 一 个 复杂 的 过 程 ， 它 需要 很 长 的 计算 时 间 。 当 IZO 的 设置 固定 之 
后 ， 每 次 代码 修改 后 不 需要 重新 综合 整个 电路 。 我 们 可 通过 FPGA 的 JTAG 接口 
将 机 器 语言 代码 重 载 到 ROM, 该 КОМ 采用 block RAM 实现 。 这 与 图 154 虚线 
所 示 的 步骤 9 一致 。 基 本 的 流程 如 下 : 

1) HEA JTAG 接口 电路 的 模板 替换 原始 的 ROM 模板 ; 

2) 使 用 KCPSM3 编译 汇编 代码 ; 

3) 综合 顶层 HDL 代码 ， 并 对 FPGA 芯片 编程 ; 

4) 如 果 汇 编 子 程序 做 了 修改 ， 需 重新 进行 综合 ， 生 成 扩展 名 为 hex 的 文 
件 ; 

5) 使 用 Xilinx 工具 将 . hex 文件 内 艇 到 JTAG 编程 文件 中 ， 并 由 JTAG 接口 下 
235 FPGA 的 block RAM 中 。 

详细 过 程 及 相关 程序 和 模板 可 在 下 载 的 KCPSM 文件 中 的 JTAG-loader 目录 下 
找到 。 


16. 5.4 PBlazeIDE 编译 


正如 前 面 论 述 的 ，PBlazeIDE 是 一 个 包含 编译 器 和 编辑 器 的 集成 软件 。PB- 
lazeIDE 还 能 产生 指令 ROM HDL 文件 。 但 这 个 文件 只 能 是 VHDL 文件 。 由 于 Xil- 
inx IST 支持 混合 语言 仿真 ， 这 个 文件 仍 可 以 被 例 化 到 顶层 Verilog 模块 。 详 细 过 
程 在 IST 用 户 手 册 中 有 介绍 。 

为 了 得 到 指令 ROM 文件 ， 我 们 将 vhdl 指令 包含 到 汇编 代码 中 。 语 法 格式 为 

vhdl " ROM form. vhd”, " rom target. vhd” , " rom entity name" 
这 3 个 参数 分 别 指定 了 VHDL 模板 文件 〈 已 在 16.5.1 节 论 述 )、 产 生 的 ROM 
VHDL 文件 的 名 称 和 VHDL 文件 中 实体 的 名 称 。 值 得 注意 的 是 ， 由 于 PBlazelDE 
未 产生 . hex 文件 ，16. 5. 3 节 讲 述 的 重 载 过 程 在 此 不 能 直接 使 用 。 
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16.6 PicoBlaze 综合 


为 指令 ROM 产生 HDL 文件 后 ， 可 将 其 与 PicoBlaze 联合 起 来 ,将 FPGA 芯片 
上 的 整个 系统 进行 综合 。 和 普通 微 处 理 器 不 同 ，PicoBlaze 没有 内 置 的 VO 外 转 
设备 。LO 端口 是 根据 需要 创建 和 定制 的 ， 相 应 电路 在 HDL 代码 中 有 描述 。 由 
于 本 章 重 点 是 汇编 程序 设计 ， 我 们 使 用 一 个 简单 的 IO 配置 端口 来 进行 综合 ， 它 
仅 包含 一 个 转换 器 输入 端口 和 一 个 LED 输出 端口 。 更 多 复杂 的 VO 接口 将 在 第 
17 章 和 第 18 章 进 行 论述 。 

设计 的 顶层 模块 结构 如 图 16-3 所 示 ， 它 包含 PicoBlaze 处 理 器 KCPSM3 、 指 
令 ROM 和 一 个 寄存 器 。 寄 存 器 作为 8 个 LED 数据 的 缓存 。 当 PicoBlaze 执行 
output 指 令 时 ， 将 数据 放置 到 out _port 端口 并 置 write _strobe 信号 有 效 ， 将 数据 存 
储 到 寄存 器 。sw 信号 连接 到 in port 端口 ， 当 PicoBlaze 执行 input 指令 时 ， 输 入 
端口 获取 sw 信和 号 的 值 并 存储 到 内 部 寄存 器 。 示 例 16. 3 列 出 了 相应 的 HDL 代码 。 
它 包含 PicoBlaze 处 理 器 和 指令 ROM 的 例 化 及 一 段 输 出 缓存 相关 的 代码 。 
KCPSM3 模块 是 PicoBlaze 处 理 器 ， 它 的 代码 存储 在 同 为 该 名 的 HDL 文件 中 ，sio 
_rom 模块 是 前 面 产生 的 指令 ROM 配置 文件 。 


sw 













In_port out_port 
reset port_id 

read strobe 
write strobe 


clk —— 
instruction 


interrupt interrupt. аск 
address 
KCPSM3 


图 16-3 具有 简单 VO 接口 的 PicoBlaze 


示例 16.3 PicoBlaze 实现 一 个 简单 的 VO 配置 


module pico sio 
( 
input wire clk, reset, 
input wire [7; 0] sw, 
output wire [7: 0] led 
) 3 
tea FAA 
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// KCPSM3/ROM 信和 号 
wire [9; 0] address; 
wire [17: 0] instruction; 
wire [7: 0] port id , іп рогі, ош port ; 
wire write strobe; 
ГЕЧЕ 5. 
reg [7: 0] led reg; 


// 实体 
КҮ ГГ Л ГУЛ ТТЛ Л Т ГУС 
// KCPSM 和 ROM 实例 

a i a Л Г Г О Т 


kcpsm3 proc unit 
(. clk (clk), . reset (reset), . address (address) , 
. instruction (instruction) , . port id () , 
. write. strobe ( write strobe) , . out. port (out рогі), 
.read strobe (), .in port (in port), . interrupt (l'bO), 

. interrupt ack ()) ; 

sio rom rom unit 
( .clk (clk) , . address (address), 


. instruction. ( instruction) ) ; 


always Q ( posedge clk) 
if ( write strobe) 
led reg < =ош port ; 
assign led = led reg; 


assign in port = sw; 


endmodule 


- 466 - 用 Verilog 设计 FPGA 样机 实例 解析 (Xilinx Spartan-3 版 ) 





16.7 文献 备注 


本 章 的 文献 备注 内 容 和 第 15 章 相似 。 基 于 JTAG 端口 的 编译 后 代码 重 载 过 
程 在 Kris Chaplin 和 Ken Chapman 的 著作 《PicoBlaze JTAG Loader Quick User 
Guide》 中 进行 了 论述 。 该 文章 在 下 载 的 KCPSM 文件 JTAG-loader 目录 下 可 找到 。 


16.8 实验 


16.8.1 有 符号 数 乘法 运算 


示例 16. 1 中 子 程序 将 输入 作为 无 符号 整 型 数据 处 理 。 更 改 子 程序 进行 有 符 
号 数据 的 乘法 运算 ， 输 入 和 输出 均 作为 有 符号 数 处 理 ， 并 通过 仿真 进行 验证 。 


16.8.2 多 字 节 乘法 运算 


示例 16. 1 程序 中 输入 数据 位 宽 为 8 位 ， 一 些 应 用 可 能 需要 更 高 的 精度 。 我 
们 想 将 程序 扩展 ， 使 输入 为 16 位 无 符号 数 ， 一 个 操作 数 现在 需要 两 个 寄存 器 ， 
输出 结果 需要 4 个 寄存 器 。 改 进程 序 并 且 进 行 仿真 验证 。 


16.8.3 ”循环 位 移 功能 


PicoBlaze 仅 能 位 移 或 循环 位 移 1 位 ,“ 桶 形 ” 位 移 功能 可 实现 多 位 的 位 移 。 
此 功能 需 有 3 个 输入 寄存 器 ， 第 一 个 寄存 器 存放 将 被 位 移 的 数据 ， 第 二 个 寄存 器 
在 0~7 范围 内 设 定 移 的 位 数 ， 第 三 个 寄存 器 指示 操作 类 型 一 左 移 、 右 移 、 循 环 
左 移 或 循环 右 移 。 改 进程 序 并 且 进 行 仿真 验证 。 


16.8.4 高 低位 互 置 功能 


高 低位 互 置 功 能 是 指 将 输入 数据 的 高 位 和 低位 倒转 互 换 。 如 果 输 入 数据 为 
“01010011”， 则 输出 数据 为 “11001010”。 我 们 可 以 使 用 8bit 的 转换 器 输出 数据 
作为 输入 ， 而 用 8bit 的 离散 LED 作为 输出 。 编 写 代码 ， 进 行 仿真 ， 并 获得 指令 
ROM 文件 ， 生 成 顶层 HDL 代码 ， 将 整个 系统 进行 综合 、 验 证 。 


16.8.5 ”二进制 码 至 BCD 码 转换 


二 进 制 码 至 BCD 码 转换 在 6. 3. 3 节 进 行 了 介绍 ， 此 功能 可 使 用 汇编 代码 实 
现 。 设 定 输入 为 8bit 二 进 制 数 ， 输 出 为 两 个 阿拉 伯 数 字 的 8bit BCD 码 。 如 果 输 
和 大 于 99 ， 输 出 设置 为 溢出 标志 “11111111”。 我 们 可 以 使 用 8bit 的 转换 器 输出 
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数据 作为 输入 ， 而 用 8bit 的 离散 LED 作为 输出 。 编 写 代码 ， 进 行 仿 真 ， 并 获得 
指令 ROM 文件 ， 生 成 顶层 HDL 代码 ， 将 整个 系统 进行 综合 、 验 证 。 


16.8.6 BCD 码 至 二 进 制 码 转换 
重复 实验 16. 8. 5， 编 写 代 码 ， 综 合 出 电路 ， 实 现 BCD 码 到 二 进 制 码 的 转换 。 
16.8.7 心跳 电路 


“心跳 电路 ”在 实验 4.7.4 进行 了 讲解 ,我们 也 可 以 使 用 8bit 的 离散 LED Ж 
现 一 个 类 似 的 模型 。 编 写 代 码 ， 进 行 仿真 ， 并 获得 指令 ROM 文件 ， 生 成 顶层 
HDL 代码 ， 将 整个 系统 进行 综合 、 验 证 。 


16.8.8 旋转 闪 亮 LED 电路 


我 们 想 设 计 一 个 电路 ,将 4 种 LED EPE “00000001”, “00000011”, 
“00001111” 和 “00001101” 用 4 种 不 同 的 速度 进行 左 移 或 右 移 。 图 样 、 方 向 和 
旋转 速度 可 通过 8bit 的 转换 器 〈 只 使 用 Sbit) 进行 选择 。 速 度 应 进行 合理 选择 以 
使 4 种 图 样 全 能 展现 出 来 。 编 写 代 码 ， 进 行 仿真 ， 并 获得 指令 ROM 文件 ， 生 成 
顶层 HDL 代码 ， 将 整个 系统 进行 综合 、 验 证 。 


16.8.9 离散 LED 调 光 器 


PWM 和 LED 调 光 天 的 概念 在 实验 4. 7. 2 已 进行 了 介绍 。 在 本 实验 中 , 我们 
想 使 用 8 个 离散 的 LED 显示 不 同 级 别 的 亮度 。 这 可 通过 改变 LED 的 “on” 分 数 
值 来 实现 ，8 个 LED 的 “on” 分 数值 将 为 8/8、7/8、6/8、…、1/8。 编 写 代 码 ， 
进行 仿真 ， 并 获得 指令 ROM 文件 ， 生 成 顶层 HDL 代码 ， 将 整个 系统 进行 综合 、 
验证 。 
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17.1 简介 


使 用 一 个 规范 的 由 多 种 内 置 VO 外 围 接口 〈 例 如 UART、SPI、 定 时 器 等 ) 
组 成 的 微 控制 器 芯片 来 完成 与 外 部 环境 的 交互 。 当 启动 一 个 新 的 开发 过 程 时 ， 我 
们 需要 依据 VO 在 应 用 方面 的 需求 去 选择 微 控制 器 芯片 ， 许 多 情况 下 还 需要 使 用 
额外 的 芯片 去 实现 一 些 不 太 常 见 的 功能 。 

不 同 于 常规 微 控 制 器 ，PicoBlaze 中 并 不 包含 内 置 的 外 设 L/O, PicoBlaze 中 只 
有 一 个 简单 的 YO 接口 。PicoBlaze 的 外 设 VO 需要 根据 需要 来 定制 。PicoBlaze 使 
用 IO 接口 来 在 内 部 寄存 器 和 IO 端口 之 间 传输 数据 。LO 接口 包含 以 下 信号 : 

€ port id; 8bit, L/O 端口 id (或 端口 地 址 ) ; 

@ in_port: 8bit， 数 据 输入 端口 ，PicoBlaze 使 用 input 指令 从 该 端口 获取 数 
据 ; 

@ out_port: 8bit， 数 据 输出 端口 ，PicoBlaze 使 用 output 指令 来 通过 该 端口 输 
出 数据 ; 

@ read_strobe: 1bit， 标 志 信号 ， 该 信号 在 input 指令 的 第 二 个 时 钟 周 期 置 为 
有 效 ; 

€ write_strobe: 1bit， 标 志 信号 ， 该 信号 在 output 指令 的 第 二 个 时 钟 周期 置 
为 有 效 。 

尽管 仅 有 两 个 8bit 端口 用 于 输入 、 输 出 数据 ， 但 port_ id 可 以 被 用 于 区 别 不 
同 的 外 设 ， 因 此 PicoBlaze 可 以 最 多 支持 256 (BD 2°) 个 IO 端口 。 

在 本 章 接 下 来 的 部 分 中 ， 我 们 将 仔细 研究 PicoBlazel/O 的 时 序 ， 通 过 为 第 16 
章 中 所 述 电 路 增加 一 系列 外 设 接口 ， 我 们 将 进一步 说 明 如 何 进行 VO 接口 的 开 
发 。 


17.2 输出 端口 


17.2.1 output 指令 及 时 序 
通过 output 指令 向 输出 端口 写 数 据 ， 有 两 种 格式 : 
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output sX, (sY) 

output sX, Ў 1 47 
第 一 种 格式 中 ， 端 口 id 存储 于 sY 寄存 器 中 。 第 二 种 格式 中 ， 端 口误 通过 端口 名 
来 直接 指定 ， 端 口 名 为 一 个 两 位 的 十 六 进 制 数 或 者 一 个 预先 定义 好 的 符号 常量 。 
输出 数据 存储 于 sX 寄存 器 中 。 

输出 指令 的 时 序 图 ， 

output s0, 02 
在 图 17-1 中 最 上 部 的 五 行 显示 。 前 文 说 过 每 个 PicoBlaze 指令 需要 两 个 时 钟 周 
ЯН, 在 指令 被 执行 的 两 个 时 钟 周期 内 ，s0 的 内 容 会 被 传输 至 输出 端口 上 ， 同 时 
端口 id 置 为 02。write_strobe 信号 在 第 二 个 时 钟 周期 被 置 为 有 效 ， 该 信号 可 以 作 
为 在 输出 寄存 器 中 保存 数据 的 使 能 标志 或 用 于 对 外 设 进行 初始 化 。 


clk 


instruction 性 л 输出 s0.02 l | 


MPicoBlaze port_id 
Ma 


out_port 


write_strobe 


en d[0] 





en [1] 


后 信号 еп 402] | | | | 
| 
1 
1 


en d[3] | 


out data2 s0 的 内 容 


采样 和 存储 的 sS0 内 容 
图 17-1 输出 结构 时 序 图 


17.2.2 输出 接口 


PicoBlaze 和 输出 外 设 之 间 的 输出 接口 通常 包含 有 解码 电路 和 输出 缓存 ， 输 
出 缓存 通常 由 寄存 器 阵列 构成 。 解 码 电路 解析 端口 d， 并 据 此 生成 一 个 使 能 信 
号 。 输 出 指令 执行 后 ， 数 据 会 存储 到 指定 的 缓存 中 。 

我 们 以 四 输出 的 PicoBlaze 接口 为 例 来 说 明 这 种 结构 。 指 定 00,,, 01,6. 02 
和 0316 作 为 其 端口 da。 可 见 ， 端 口 地 址 的 6 个 MSB 是 一 样 的 ， 仅 用 两 个 LSB 去 
区 分 一 个 端口 。 方 框图 如 图 17-2 所 示 。 其 中 核心 为 解码 电路 ， 表 17-1 为 解码 电 
路 功能 真 值 表 ， 它 是 一 个 2-2 解码 器 。 在 输出 指令 的 第 二 个 时 钟 周期 ，write- 
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strobe 被 置 为 有 效 ，en_d 信号 中 的 其 中 1 位 也 置 为 有 效 。en_d 为 单 时 钟 周期 使 能 
信号 ， 每 一 位 对 应 相应 的 寄存 器 。 当 某 一 位 置 为 有 效 时 ， 相 应 的 寄存 器 便 从 输出 
端口 中 获取 数据 。 


out dataÜ 





read strobe 
write strobe 


out datal 


interrupt ack 
address 
KCPSM3 


out data2 


out data3 








图 17-2 ЧН КИН Hj TRES РА 


表 17-1 解码 电路 真 值 表 


输入 
write_strobe 端口 iarl] 端口 id[0] 


























该 指令 的 解码 时 序 图 


output s0, 02 
在 图 17-1 底部 显示 。 在 输出 指令 的 第 二 个 时 钟 周 期 ，en_d[2] 置 为 有 效 ， 输 出 接 
口中 的 数据 在 下 一 个 时 钟 上 升 沿 存储 在 en_d[2] 所 对 应 的 缓存 中 。 
一 旦 了 解 了 基本 的 操作 ， 我 们 就 能 据 此 来 编写 HDL 代码 。 代 码 段 为 
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always @ * 
if ( write. strobe ) 
case ( port id[1:0]) 
2' b00: en d =4’ b0001 ; 
2'b01: en d =4’ b0010; 
2' bl0; en d =4’ b0100; 
2' bl1: en d =4’ b1000; 
endcase 
else 
en. d -4' b0000; 
这 个 设计 非常 的 概括 ， 可 以 扩展 至 任意 数量 输出 端口 。 
端口 地 址 的 选择 较为 随意 。 我 们 在 上 个 例子 中 使 用 二 进 制 编码 的 方式 来 定义 
端口 地 址 。 如 果 输 出 端口 的 数量 小 于 8， 独 热 码 可 以 被 用 于 简化 解码 电路 。 例 
如 ， 我 们 可 以 定义 上 面 的 4 个 端口 id Jg: Ole (40, 00000001,). 02, (ll, 
00000010,). 04, (#1, 00000100,) #108, (АП, 00001000, ) 。 解 码 逻 辑 可 以 简 
化 为 
always @ * 
if ( write_strobe ) 
en d = port_id[ 3:0]; 
else 
en_d =4’ b0000; 
值得 注意 的 是 ， 如 果 仅 有 一 个 输出 端口 ， 那么 就 不 需要 解码 逻辑 。Write- 
strobe 信号 可 以 连接 到 寄存 器 使 能 信号 端 ， 如 图 16-3 所 示 。 
在 16.4.2 节 中 讨论 的 ， 一 个 好 的 方法 是 使 用 符号 化 命名 的 方式 去 定义 WO 
端口 ， 并 且 在 头 文件 中 定义 二 进 制 地 址 。 例 如 ， 输 出 端口 地 址 分 配 可 以 声明 如 


constant out-port-a，00 

constant out-port-b ，01 

constant out-port-c, 02 

constant out-port-d, 04 
如 果 地 址 分 配 变 更 ， 我 们 仅 更 新 头 文件 即 可 ， 这 样 就 保证 了 其 余 代 码 的 完整 性 。 
使 用 清晰 的 头 文件 ， 同 样 可 以 令 我 们 轻松 地 更 改 同 伴 开 发 的 HDL 文件 的 端口 id。 
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17.3 输入 端口 


17.3.1 输入 指令 和 时 序 


输入 指令 从 输入 端口 读 取 数据 。 与 输出 指令 相似 ， 其 具有 两 种 格式 : 
input sX,(sY) 
output sX , рогі name 
sY 寄存 器 或 端口 名 用 于 指示 读 端口 id。 读 取 的 数据 被 存储 在 sX 寄存 器 中 。 
输入 指令 的 时 序 图 ， clk 
input 30, 02 instruction 输入 s0.02 
在 图 17-3 中 显示 。 当 指令 被 执行 ， | e y 
端口 这 置 为 02 。 两 个 时 钟 周期 后 ， 7T 
输入 端口 中 的 数据 会 在 时 钟 的 上 升 "оп 
沿 被 采样 ， 并 存储 在 sO 寄存 器 中 。 read strobe 
外 部 电路 必须 确保 输入 数据 在 采样 register sO 
时 钟 沿 保持 稳定 ， 从 而 避免 一 些 时 
序 违规 。 
如 同 输出 指令 中 一 样 ，read- 图 173 MARTENA 
strobe 信号 在 第 二 个 时 钟 周期 的 上 升 沿 置 为 有 效 。Read-strobe 信号 的 功能 不 是 很 
明显 ， 这 部 分 会 在 此 后 的 章节 中 讨论 。 


17.3.2 输入 接口 


PicoBlaze 和 输入 外 设 之 间 的 输入 接口 通常 包含 多 路 选择 器 ， 多 路 选择 器 使 
用 port_id 作为 选择 信号 来 为 in_port 选择 所 需 的 数据 。 有时， 输入 接口 也 需要 类 
似 输出 接口 中 的 解码 电路 来 实现 数据 访问 。 

在 输入 接口 设计 的 过 程 中 ， 输 入 端口 可 以 被 分 为 连续 访问 或 单独 访问 端口 。 
对 于 一 个 连续 访问 端口 来 说 ， 数 据 是 连续 出 现 的 ， 类 似 于 16.4. 1 节 中 的 选择 输 
入 。 而 单独 访问 端口 的 数据 有 效 性 是 由 单独 的 无 关 事件 所 触发 的 ， 例 如 通过 
UART buffer 接收 一 个 字符 。8. 2. 4 节 中 讨论 的 标志 寄存 器 和 buffer 就 属于 这 种 类 
别 。 数 据 被 获取 后 ， 我 们 需要 将 其 从 buffer 中 移出 ， 以 防止 相同 的 数据 被 重复 读 
取 。 通 常用 单 周期 的 信号 去 清空 标志 寄存 器 或 将 一 个 字 从 FIFO buffer 中 移出 。 

连续 访问 端口 的 接口 仅 包 括 一 个 多 路 选择 器 电路 。 以 一 个 包括 4 个 此 种 端口 
的 接口 为 例 ， 方 框图 如 图 17-4 所 示 。 

单独 访问 端口 的 接口 需要 一 个 状态 机 在 输入 指令 结束 时 将 获取 的 数据 从 
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in_port out_port 
; reset port id 
in dataÜ 
Е | | read strobe 
instruction А 
In_datal write strobe 


interrupt interrupt ack 
' address 
in data2 KCPSM3 


in data3 


图 174 四 连续 访问 端口 方 框图 


in_data0 


write strobe 


interrupt ack 


address 
KCPSM3 














图 17-5 ”四 单独 访问 端口 方 框图 


buffer 中 移出 。 可 以 通过 解码 电路 来 对 port. id 和 read-strobe 进行 解码 。 解 码 电路 
同 输出 接口 中 的 解码 电路 是 相同 的 ， 只 是 将 write-strobe 替换 成 read-strobe。 解 码 
器 的 输出 可 以 看 做 单 时 钟 周期 的 “清除 ”信号 。 以 一 个 包含 4 个 FIFO 的 接口 为 
例 。 完 整 的 解码 和 多 路 电路 框图 如 图 17-5 中 显示 。 信 和 号 r 为 解码 得 到 的 “ 清 
除 ” 信 号 。 在 输入 指令 结束 后 ， 该 4bit 信号 中 的 1bit 将 置 为 有 效 ， 相 应 的 FIFO 
会 执行 一 次 读 操 作 ， 第 一 个 字 将 从 buffer 中 移出 。 假 设 端口 id 为 00. 0146. 02, 
和 03ie。 则 接口 的 HDL 代码 为 

// 复 用 电路 

always @ ж 

case (port id[ 1:0]) 
2" b00 : data = in. data0; 
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2'b01: data =in_datal ; 
2'b10 ; data = in_data2 ; 
2'bll : data = in data3; 
endcase 
// 解码 电路 
always @ * 
if (read. strobe ) 
case ( port id[ 1:0]) 
2' b00 : rv =4’ b0001 ; 
2'b01 : rv =4’ b0010; 
2' ЬО : rv =4 b0100; 
2'bll : rv =4’b1000; 
endcase 
else 
rv =4’ b0000; 
在 实际 应 用 中 ， 输 入 接口 通常 既 包 含 连 续 访 问 接口 也 包含 单独 访问 接口 。 解 
码 电路 只 在 单独 访问 接口 中 才 有 。 


17.4 包含 开关 输入 和 7 & LED 显示 接口 的 二 次 方 计算 程序 


为 了 进一步 说 明 PicoBlaze L/O 接口 的 架构 ， 我 们 以 第 16 章 中 的 二 次 方 计算 
程序 为 例 ， 添 加 更 多 的 通用 外 设 。 二 次 方 计算 程序 的 功能 是 计算 а? +b КИН, 
其 中 和 "为 8 位 无 符号 整 型 数 。 

我 们 使 用 8bit 开关 和 一 个 按钮 来 输入 数值 a 和 5。 当 按 下 按钮 会 生成 一 个 单 
时 钟 周期 的 标志 信号 。 此 标志 信号 指示 当前 开关 的 数值 需要 被 导入 。 数 值 a。 F b 
会 被 交替 导 人 ; 例如 : 第 一 次 按 下 按钮 会 导入 a， 第 二 次 按 下 就 会 导 和 人 56， 第 三 
次 又 会 导入 a， 以 此 类 推 。 使 用 男 外 一 个 按钮 来 清空 PicoBlaze 的 数据 RAM 和 相 
XA ff fit o 

我 们 使 用 4 个 七 段 LED 来 显示 输入 和 计算 结果 。LED 被 设 定 为 4 个 十 六 进 
制 数 。 因 为 c + b° 数值 范围 最 大 为 17bit， 最 左 端的 LED 的 小 数 点 用 于 指示 
MSB。 开 关 的 最 低 3 个 bit HR a, b. a^, b^ Ra +0? 哪 一 个 被 显示 。 

综 上 所 述 ， 接 口 包括 以 下 内 容 : 

° 开关 : 提供 a Alb 的 数值 ,选择 LED 显示 的 内 容 ; 

e 按 钮 0: 当 按 下 时 交替 导 人 数值 a。 b; 

9 按钮 1: 当 按 下 时 清空 数据 КАМ 及 其 相关 的 寄存 器 ; 
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e-EE LED: 按 4 个 十 六 进 制 数 的 方式 显示 所 选择 的 17 bit 数值 。 
17.4.1 输出 接口 


原型 开发 板 上 的 4 个 七 段 LED 共享 相同 的 输入 引 脚 ， 因 此 我 们 需要 设计 一 
个 时 分 复 用 电路 。 在 基于 PicoBlaze 的 设计 中 ， 复 用 电路 既 可 以 使 用 外 部 电路 实 
现 也 可 以 通过 软件 程序 实现 。 本 节 中 我 们 选择 外 部 电路 的 方式 ， 这 样 能 够 简化 汇 
编 代 码 的 开发 ， 第 18 章 中 将 会 讨论 软件 程序 实现 的 方法 。 在 这 里 ， 我 们 可 以 使 
用 4.5.1 节 中 所 讨论 的 LED 时 分 复 用 电路 。 该 电路 使 得 时 分 复 用 的 过 程 对 于 外 
部 系统 而 言 是 透明 的 ， 外 部 系统 所 能 看 到 的 是 4 个 相互 独立 的 7 Be LED, PicoB- 
laze 的 输出 接口 方 框图 在 图 17-6 中 显示 。 接 口 包括 4 个 8bit 输出 端口 ， 每 个 端口 
对 应 一 个 LED。 





in_port out port 
reset port id 


А . read strobe d 
instruction Write strope 
interrupt interrupt ack E b 
address 
KCPSM3 
disp_mux 
> 


图 17-6 二 次 方 电路 的 输出 接口 





sseg 





an 








在 汇编 代码 中 ，4 个 LED 分 别 对 应 PicoBlaze 数据 RAM 的 4 个 地 址 ， 分 别 为 
led0 、ledl led2 和 led3 。 相 应 的 代码 段 为 


;data RAM address alias 
constant led0 ,10 
constant ledl ,11 
constant led2 ,12 
constant led3 ,13 
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;output port definitions 

constant ssegÜ port ,00 ;7-seg led 0 
constant sseg]_port ,01 ;7-seg led 1 
constant sseg2 port,02 ;7-seg led 2 
constant sseg3_port ,03 ;7-seg led 3 


disp. led: 
fetch data, ledO ; 
output data,ssegÜ port 
fetch data ,ledl ; 
output data,ssegl port 
fetch data, led2 ; 
output data,sseg2 port 
fetch data ,led3 ; 
output data,sseg3 port 


return 
17.4.2 输入 接口 


输入 接口 包含 一 个 8bit 开关 和 两 个 1bit 按钮 。 前 者 为 一 个 连续 访问 端口 ， 其 
数值 是 持续 有 效 的 。 后 者 为 一 个 单独 访问 端口 ， 因 为 按 下 一 个 按钮 只 会 触发 一 个 
事件 〈 向 寄存 器 中 导 人 一 次 数据 ， 而 非 连续 导入 ) 。 由 于 机 械 按钮 会 产生 毛刺 ， 
因此 需要 使 用 去 拌 动 电路 来 产生 单 时 钟 周期 的 脉冲 激励 。 因 为 PicoBlaze 的 端口 
可 以 接收 8bit 数据 ， 从 两 个 按钮 的 输入 可 以 整合 为 一 组 ， 作 为 一 个 独立 的 输入 端 
口 。 输 入 接口 的 方 框图 在 图 17-7 中 显示 。 接 口 包括 两 个 去 抖动 电路 ， 一 个 2 选 1 
的 多 路 选择 器 ， 一 个 解码 电路 ， 两 个 标志 寄存 器 。 两 个 标志 寄存 器 的 功能 在 
8.2.4 节 中 已 讨论 过 。 它 们 用 于 置 位 和 复位 “按钮 触发 事件 ”。 当 一 个 按钮 被 按 
下 ， 去 抖动 电路 的 输出 会 将 标志 寄存 器 置 位 。 在 PicoBlaze 发 出 输入 指令 前 ， 该 
标志 寄存 器 会 一 直 保 持原 值 。 输 入 指令 设置 多 路 选择 器 的 选择 信号 ， 从 而 将 期 户 
的 数据 传输 至 PicoBlaze 的 输入 端口 ， 并 激活 复位 信号 。 为 了 便于 讨论 ， 我 们 将 
按钮 1 命名 为 s 按钮 (用 来 进行 数值 设置 ) ， 按 钮 0 命名 为 c 按钮 (用 来 复位 数 
据 RAM) 。 

执行 输入 的 伪 代 码 为 

; input the button flags 
; if c=1 then 


call the clearing-ram routine 


第 17 章 PicoBlaze I/O 接口 . 477 - 





; if s=1 then 
; input switch value 
; store it to data ram 


; toggle a/b address offset 













in port out port 
reset рогі id 

read strobe 
write strobe 






btnc flag 






instruction 


btns flag interrupt interrupt ack 


address 
KCPSM3 





btn[1] 














图 17-7 电路 输入 接口 图 


因为 s 按钮 交替 输入 a 和 6b， 我 们 使 用 一 个 全 局 寄存 器 switch | a_ b 来 记录 
当前 正在 读 取 的 数值 是 a 还 是 5。 该 寄存 器 的 值 同 时 也 是 数据 RAM 地 址 的 偏 移 
量 ， 其 值 可 以 为 0 或 2， 并 且 在 s 按钮 被 按 下 时 锁 存 。 相 应 的 汇编 代码 子 程序 为 
;input port definitions 


constant rd, flag port,00;2 flags ( xxxxxxsc ) ; 


proc Ып; 
input s3,rd flag port;get flag 
;check and process c button 
test s3 ,01 ; check c button flag 
jump z,chk btns;flag not set 
call init; flag set, clear 
jump proc_btn_done 

chk. btns: 


;check and process s button 
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test 53 ,02 ; check s button flag 

jump z,proc. btn done;flag not set 

input data,sw. port; get switch 

load addr,a lsb;get addr of a 

add addr,switch a b;add offset 

store data, (addr) ;write data to ram 

;update current disp position 

xor switch a b,02;toggle between 00,02 
proc btn done; 


return 


17.4.3 集成 代码 开发 


在 完成 WO 接口 设计 后 ， 我 们 可 以 开始 设计 汇编 程序 。 本 开发 遵循 第 16 章 
提出 的 分 解法 来 进行 ， 将 主 程序 划分 成 若干 子 程序 。 主 程序 为 
call init;initialization 
forever: 
;main loop body 
call proc. Ып; check & process buttons 
call square; calculate square 
call load led pttn;store led patterns to ram 
call disp. led ; output led pattern 
jump forever 
完整 代码 在 示例 17. 1 中 列 出 。 
二 次 方 子 程序 来 自 第 16 Жї, proc_btn 和 disp led 子 程序 在 之 前 的 两 个 章节 中 
已 经 进行 过 讨论 。init 子 程序 用 于 实现 系统 的 初始 化 ， 使 用 loop 循环 将 0”s 导 
入 数据 КАМ ( 即 复位 КАМ) 并 将 switch a. b 寄存 器 置 为 0 ( 即 读 取 a)。load_ 
led_pttn 子 程序 读 取 开 关 输 入 ， 从 КАМ 中 获取 所 需 的 数据 ， 将 数值 转换 成 七 段 
LED 所 需 的 格式 ， 并 将 它们 存 人 RAM 相应 的 地 址 空间 中 。 这 些 数据 随后 通过 
disp-led 子 程序 写 人 输出 端口 。load-led-ptin 子 程序 包括 get-uppernibble 子 程序 和 
get-lowernibble 子 程序 ， 用 于 生成 8bit 所 对 应 的 两 个 十 六 进 制 数字 ，hex-to-led + 
程序 将 一 个 十 六 进 制 数字 转换 成 相应 的 7 Ez LED 格式 。 
这 个 程序 需要 更 多 的 存储 空间 。 除 了 数据 RAM 和 用 于 二 次 方 计算 程序 的 寄 
存 器 外 ， 本 程序 还 使 用 了 一 个 新 的 全 局 寄存 器 switch-a-b 去 标志 究竟 是 a 还 是 b 
正在 被 读 取 。 同 时 ， 数 据 RAM 中 有 四 字 节 的 地 址 被 标注 为 ltd0、ledl1、led2 和 
led3, iX 4 个 字 节 的 存储 空间 用 来 存储 4 个 7 段 LED 的 显示 输出 。 
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示例 17.1 包含 开关 和 7 Be LED 接口 的 二 次 方 计 算 程 序 


;program operation : 

;-read a and b from switch 
;-calculate a * a +b * b 
;-display data on 7-seg led 


MÀ € i a € mmm ama € s= ái e t a ai m € amam <a a чын» À ee i que mman € € € wama € € À— € ——M— € (c ene 


constant a, lsb ,00 
constant b_Isb ,02 
constant aa_Isb ,04 
constant aa_msb ,05 
constant bb_Isb ,06 
constant bb_msb ,07 
constant aabb_Isb ,08 
constant aabb_msb ,09 
constant aabb_cout ,OA 
constant led0 ‚10 
constant ledl ‚11 
constant led2 ‚12 
constant led3 ‚13 


;commonly used local variables 

namereg 50 , data ;reg for temporary data 

namereg sl , addr;reg for temporary mem & i/o port addr 
namereg s2 ‚1; general-purpose loop index 

; global variables 
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а= input port 
definitions--------------------------------------------- 

constant rd flag port,00;2 flags ( xxxxxxsc ) : 

constant sw. port ,01 ;8-bit switch 

和 output port 
definitions---------- 

constant sseg0_port ,00 ;7-seg led 0 

constant ssegl port,01;7-seg led 1 

constant sseg2 port ,02 ;7-seg led 2 

constant sseg3 port,03 ;7-seg led 3 


;calling hierarchy 
;main 

; -init 

; -proc btn 

: -init 

; -square 

; -mult_soft 

; -load led pttn 

; -get lower nibble 
; -get_upper_nibble 
; -hex_to_led 

; -disp_led 


call init;initialization 
forever: 
;main loop body 
call proc. btn;check & process buttons 
call square ; calculate square 
call load led pttn;store led patterns to ram 
call disp led;output led pattern 
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jump forever 


;routine ; init 

; function; perform initialization , clear register/ram 
; output register; 

; switch. a. b:cleared to 0 


; temp register; data , i 


;clear memory 
load 1,40; unitize loop index to 64 
load data,00 
clr mem loop: 
store data, (1) 
sub 1,01 ;dec loop index 
jump nz,clr mem loop;repeat until i 20 
; clear register 
load switch. a. b,00 


return 


; routine ; proc btn 
; function; check two buttons and process the display 
; input reg: 
; switch_a_b:ram offset(0 for a and 2 for b) 
; Output register: 
; 53 :store input port flag 
; switch_a_b;may be toggled 
; temp register used ; data, addr 
proc_btn; 
input s3,rd flag рогі; веі flag 
;check and process c button 
test s3 ,01 ; check c button flag 
jump z,chk_btns; flag not set 
call init; flag set, clear 
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jump proc_btn_done 
chk_btns: 
;check and process s button 
test s3 ,02 ; check s button flag 
jump z,proc btn done;flag not set 
input data, sw. port; get switch 
load addr,a lsb;get addr of a 
add addr, switch_a_b;add offset 
store data, ( addr) ; write data to ram 
;update current disp position 
xor switch a b,02;toggle between 00,02 
proc btn done: 
return 
;routine:load_led_pttn 


; function;read 3 LSBs of switch input and convert the desired values to four led 


patterns 
; and load then to ram 
š switch :000 .a; 001:b; 010:а^2; 011:Ь72; others: а^2 -4b^2 


; temp register used ; data, addr 
; 56 : data from sw input port 


input s6,sw port;get switch 

810 s6; *2 to obtain addr offset 

compare s6 ,08 ;sw > 100? 

jump c,sw_ok;no 

load s6 ,08 ; yes ,sw error, make default 
sw_ok: 

;process byte 0 ,lower nibble 

load addr а lsb 

add addr,s6;get lower addr 

fetch data, (s6) ;get lower byte 

call get lower nibble;get lower nibble 

call hex to led;convert to led pattern 
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store data, led 

; process byte 0 , upper nibble 

fetch data, ( addr) 

call get_lower_nibble 

call hex_to_led 

store data, led2 

;process byte 1 , upper nibble 

fetch data, ( addr) 

call get_upper_nibble 

call hex_to_led 

;check for sw = 100 to process carry as led dp 

compare зб ,08 ; display final result? 

jump nz,led_done;no 

add addr,01;get carry addr 

fetch s6 , ( addr) ;s6 to store carry 

test s6,01 ;carry = 17 

jump z,led done;no 

and data,7F;yes,assert msb (dp) to 0 
led done: 

store data, led3 


retum 


;routine; disp. led 
; function;output four led patterns 
; temp register used: data 
disp led: 
fetch data , ledO 
output data,ssegÜ port 
fetch data, led] 
output data,ssegl port 
fetch data, led2 
output data,sseg2 port 
fetch data, led3 
output data,sseg3 port 
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;routine: hex_to_led 
; function; convert a hex digit to 7-seg led pattern 
; input register: data 
; Output register: data 
hex to led: 
compare data ,00 
jump nz,comp hex 1 
load data,81;7-seg pattern 0 
jump hex. done 
comp hex 1: 
compare data ,01 
jump nz,comp hex 2 
load data, CF ;7-seg pattern 1 
jump hex done 
comp hex 2: 
compare data ,02 
jump nz,comp_hex_3 
load data ,92 ;7-seg pattern 2 
jump hex_done 
comp_hex_3: 
compare data ,03 
jump nz,comp_hex_4 
load data ,86 ;7-seg pattern 3 
jump hex_done 
comp_hex_4; 
compare data ,04 
jump nz,comp hex 5 
load data, CC ;7-seg pattern 4 
jump hex done 
comp hex 5: 
compare data ‚05 


jump nz,comp hex 6 
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load data, A4;7-seg pattern 5 
jump hex done 
comp hex 6: 
compare data ,06 
jump nz,comp hex 7 
load data, A0;7-seg pattern 6 
jump hex done 
comp hex 7: 
compare data ,07 
jump nz,comp hex 8 
load data,8F;7-seg pattern 7 
jump hex done 
comp hex 8; 
compare data ,08 
jump nz,comp. hex 9 
load data ,80 ;7-seg pattern 8 
jump hex_done 
comp_hex_9; 
compare data ,09 
jump nz,comp_hex_a 
load data ,84 ;7-seg pattern 9 
jump hex_done 
comp hex a: 
compare data,0A 
jump nz,comp hex b 
load data ,88 ;7-seg pattern a 
jump hex_done 
comp_hex_b; 
compare data ,0B 
jump nz,comp_hex_c 
load data, E0;7-seg pattern b 
jump hex. done 
comp hex c: 
compare data ,0C 


jump nz,comp hex d 
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load data, B1;7-seg pattern C 
jump hex. done 
comp hex d: 
compare data ,0D 
jump nz,comp hex e 
load data, C2 ;7-seg pattern d 
jump hex done 
comp hex e: 
compare data ,OE 
jump nz,comp_hex_e 
load data, BO ;7-seg pattern E 
jump hex_done 
comp_hex_f; 
load data, B8 ;7-seg pattern F 
hex done: 


return 


;routine; get lower nibble 
; function; get lower 4 bits of data 
; input register; data 


; Output register; data 


get lower nibble:; 
and data ,ОЕ; clear upper nibble 


return 


;routine; get upper nibble 
; function; get upper 4 bits of in. data 
; input register; data 


; output register; data 


get upper nibble: 
sr0 data; right shift 4 times 
=0 data 
siÜ data 
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50) data 


return 


;routine; square 

; function; calculate a * a +b * b 

; data/result stored in ram started w/SQ BASE ADDR 
; temp register: s3, s4, s5, s6, data 


square; 
;calculate a * a 
fetch 53 ,a_Isb;load a 
fetch s4,a_Isb;load a 
call mult. soft ; calculate a ж a 
store s6,aa. Isb:store lower byte of a * a 
store s$,aa msb;store upper byte of a * a 
;caleulate b * b 
fetch s3,b lsb;load b 
fetch s4,b Isb;load b 
call mult. soft ; calculate b * b 
store s6,bb 15Ь: store lower byte of b * b 
store 55 ,bb_msb;store upper byte of b * b 
;caleulate a * a +b * b 
fetch data,aa lsb;store lower byte of a * a 
add data,s6;add lower byte of a * a +b b 
store data, aabb lsb;store lower byte of a * a +b * b 
fetch data ,aa_msb; get upper byte of a * a 
addcy data,s5 ;add upper byte of a * a +b * b 
store data, aabb msb;store upper byte of a * a +b * b 
load data ,00;clear data, but keep carry 
addcy data,00;get carry from previous 
store data,aabb cout;store carry of a * a +b * b 
return 

;routine ; mult. soft 


; function: 8-bit unsigned multiplier using 
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; shift-and-add algorithm 
; input register: 

; s3; multiplicand 

; s4 : multiplier 

; Output register; 

; s5 : upper byte of product 

; 56 :lower byte of product 

; temp register; i 


mult soft: 
load s5 ,00;clear s5 
load 1,08 ; initialize loop index 
mult_loop; 
50 s4;shift lsb to carry 
jump nc, shift_prod;|sb is 0 
add s5,s3;lsb is 1 
shift. prod ; 
sra 85 ;shift upper byte right, 
;carry to MSB,LSB to carry 
sra s6:shift lower byte right, 
;lsb of s5 to MSB of s6 
sub 1,01 ;dec loop index 
jump пх, тиі loop;repeat until i 20 


return 


17.4.4 HDL 代码 开发 


完整 的 HDL 代码 包含 有 PicoBlaze 处 理 器 ， 指 令 ROM， 图 17-7 所 示 的 输入 
接口 和 外 设 以 及 图 17-6 所 示 的 输出 接口 和 外 设 。 它 们 在 示例 17. 2 中 列 出 。 
示例 17.2 包含 开关 和 7 Ez LED 接口 的 PicoBlaze 


module pico Ып 
( 
input wire clk , reset , 


input wire[ 7:0] sw, 
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input wire[ 1 :0 ] btn, 
output wire[3:0] an, 
output wire[ 7 :0 | sseg 
) 
/ 信号 声明 
// KCPSM3/ROM 信和 号 
wire[ 9:0] address; 
wire[ 17:0 | instruction; 
wire[ 7:0] port. id ,out_port; 
reg[ 7:0] in. port; 
wire write strobe,read, strobe ; 
//VO NI 
// 输出 使 能 
reg[ 3:0] en d; 
//4 位 7 BLED їл 
reg[ 7:0] ds3 reg,ds2 reg,dsl reg,dsO reg; 
// PAT EEA 
reg btne flag reg,btns flag reg; 
wire btne flag next,btne flag next; 
wire set. btne flag,set btns flag,clr btn flag; 
// 实体 


disp_mux disp_unit 
(. elk( clk) ,. reset( reset) , 


. in3(ds3. reg) ,. 102 (452 reg) ,. inl (dsl reg), 


. inO( 480 reg) ,. an( an) ,. sseg(sseg) ) ; 
debounce btnc. unit 

(. elk( clk) ,. reset( reset) ,. sw(btn[0]) , 
. db level( ) ,. db tick(set btne flag)) ; 
debounce btns unit 

(. сІК( elk) ,. reset( reset) ,. sw( btn[ 1]) , 
. db level( ) ,. db tick(set btns flag) ) ; 
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// KCPSM 和 ROM 实例 


kcpsm3 proc unit 

(. clk( clk) ,. reset( 1 ' ЬО) ,. address( address) , 

. instruction( instruction) ,. рогі id( port id), 

. Write strobe( write strobe) ,. out. port( out port), 
. read. strobe( read. strobe) ,. in. port(in port), 

. interrupt( 1 ' b0) ,. interrupt ack( ) ) ; 

btn rom rom unit 

(. elk( clk) ,. address( address ) , 


. instruction( instruction ) ) ; 


// 输出 端 Did 
// 0x00 :ds0 
// 0x01 ;dsl 
// 0x02 :ds2 
// 0x03 :ds3 


СЕ 
always @ ( posedge clk) 
begin 
if( en d[0]) 
480 reg < 
if(en d[1]) 
dsl reg « 
if( en d[2]) 
ds2 reg < = оці port; 
of(en d[3]) 
ds3 reg < =ош port; 





end 


// 解码 电路 使 能 信号 
always @ x 
if( write_strobe ) 
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case( port. id[ 1:01) 
2' b00:en d =4’ b0001 ; 
2' b01 :en d =4’ b0010; 
2' bl0:en d =4’ b0100; 
2’ b1l;en d -4' 1000; 


endcase 


// # A Sig іа 
// 0x00 -flag 
// 0x01 :switch 


ЛАЧ 
always @ ( posedge clk) 
begin 
btnc flag reg < = btnc flag next; 
btns flag reg < = btns flag next; 
end 
assign Ыпс_ flag next = (set btnc flag) ? 1^ bl : 
(сіт btn flag) ? 1'bO : 
btnc flag reg; 
assign btns flag next = (set btns flag) ? 1 bl : 
(сіт btn flag) ? 1'bO : 


btns flag reg; 
// 信号 清晰 的 解码 电路 
assign clr_btn_flag = read strobe && (port_id[0] = =1'b0); 
// 输入 多 路 复 用 
always @ * 
case( port. id[0]) 


1' b0: in port = 16" bO,btns flag reg,btnc flag гер}; 


l'bl: in port = sw; 


endcase 
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endmodule 


17.5 结合 组 合 乘法 器 和 UART 控制 器 的 乘法 程序 


本 节 中 ， 我 们 会 向 前 面 的 设计 中 加 入 两 个 1⁄0 外 设 : 一 个 是 组 合 乘法 器 ， 可 
以 用 来 加 速 乘 法 运算 ， 另 一 个 是 UART， 提 供 一 个 与 PC 通信 的 链 路 。 


17.5.1 乘法 器 接口 


因为 PicoBlaze 不 包括 硬件 乘法 器 ， 乘 法 由 软件 程序 mult-soft 实现 。 运 用 移 
位 结合 加 法 的 算法 去 迭代 实现 Shit 乘法 器 。 最 坏 的 情况 下 ， 该 程序 需要 大 约 60 
条 指令 去 实现 。 男 一 种 方法 是 利用 Spartan-3 器 件 内 置 的 组 合 乘法 器 去 实现 。 

由 于 PicoBlaze 没有 提供 任何 机 制 去 使 用 一 个 协 处 理 器 ， 乘 法 器 必须 被 配置 
成 一 个 IO 外 设 。 我 们 可 以 创建 一 个 拥有 两 个 8bit 操作 数 并 会 返回 一 个 16bit Ж 
积 的 8bit 组 合 乘法 器 。 为 了 实现 此 架构 ，PicoBlaze 接口 需要 两 个 额外 的 输出 端 
口 和 buffer 以 输出 两 个 操作 数 以 及 两 个 额外 的 的 输入 端口 来 接收 16bit 的 乘积 。 
汇编 程序 只 需要 将 操作 数 输出 至 输出 端口 ， 然 后 从 输入 端口 获取 结果 即 可 。 代 码 
为 

;input port definitions 

constant mult_prod0_port ,03 ; multiplication product 8 LSBs 

constant mult prodl port,04 ; multiplication product 8 MSBs 

;output port definitions 

constant mult src port,05 ; multiplier operand 0; 


constant mult src port,06 ; multiplier operand 1; 


mult hard: 
output s3 , mult. srcÜ. port 
output sd, mult srcl port 
input s5 , mult prodl port 
input s6 , mult prodO. port 
return 
需要 注意 的 是 ， 组 合 乘法 器 可 以 通过 一 条 指令 〈 即 两 个 时 钟 周期 ) 完成 运 
算 ， 因 此 不 需要 在 代码 中 添加 额外 的 时 序 机 制 。 本 程序 可 以 替代 之 前 的 mult. soft 
程序 。 
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17.5.2 UART 接口 


使 用 UART 接口 ， 信 息 可 以 输入 到 Windows 超级 终端 并 显示 ， 其 灵活 度 和 可 

视 化 程度 比 开 关 和 LED 要 好 很 多 。 我 们 将 其 用 作 二 次 方 计 算 程序 的 一 个 简单 控 
制 台 。 典 型 界面 如 图 17-8 所 示 。 控 制 台 会 生成 一 个 SQ > 提示 ， 用 户 可 以 输入 小 
写字 母 a、b、c 或 4 作为 响应 字符 。a 和 b 字符 用 于 为 二 次 方 计算 程序 的 a 和 b 
输入 数值 。 按 键 时 ，8bit 开关 的 数值 会 被 读 取 并 存储 于 RAM 相应 的 地 址 空间 中 。 
c 字符 用 于 复位 数据 RAM， 并 对 程序 进行 初始 化 ， 其 功能 和 < 按钮 是 一 样 的 。d 
字符 用 于 数据 RAM 显示 ，RAM 中 64 字 节 的 数据 会 在 显示 器 上 显示 。 这 使 我 们 
可 以 观测 二 次 方 计算 程序 数值 变化 以 及 7 Ex LED 的 数值 。 输 入 其 他 任何 一 个 字 
符 都 会 返回 一 个 错误 信息 。 

# 53 - HyperTerminal 

File Edit View Сай Transfer Help 





> d 

000000 00 0 
001000 00 Q 
010000 00 0 


110000 00 
111000 00 


ер бр бо 0o m 
2558888 
cocco 
558585085 
оо 
N ° 
cos S 
Poe 








us 
sao 


Connected 0:01:10 Auto detect 192008М1 О 





图 17-8 典型 控制 台 界 面 


这 里 , 我 们 可 以 使 用 8.4 节 中 讨论 的 UART 模块 。 由 于 发 送 和 接收 FI- 
FObuffer 提供 了 缓存 和 标识 机 制 ， 所 以 无 需 额外 添加 任何 电路 。 我 们 仅 需 要 扩充 
译 码 和 多 路 选择 电路 去 包含 额外 的 VO 端口 。UART 接口 的 方 框图 在 图 17-9 中 进 
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行 概要 显示 ， 甚 中 其 他 的 1/0 端口 被 忽略 以 防止 混淆 。PicoBlaze 的 输出 端口 out- 
port 连接 到 UART 的 a-data 端 。 解 码 使 能 信号 连接 到 wr-uart， 当 其 有 效 时 数据 会 
被 写 人 UART 发 送 FIFO。 同 样 地 ，UART 的 rdata 连接 到 PicoBlaze 的 输入 多 路 
选择 电路 ， 解 码 后 的 复位 信号 被 连接 到 rd-uart。UART 接收 FIFO 端口 在 输入 指 
令 中 指定 ， 接 收 FIFO 输出 连接 到 PicoBlaze 的 输入 端口 in-port， 解 码 后 的 单 时 钟 
周期 移出 信号 将 一 个 字 从 接收 FIFO 中 移出 。UART 接口 同样 需要 将 rx-empty 和 
tx-full 两 个 状态 信号 连接 到 PicoBlaze 输入 多 路 选择 电路 。 汇 编程 序 需 要 在 读 写 
UART 的 FIFO 前 对 其 状态 进行 判读 。 因 为 信号 仅 有 2bit 位 宽 ， 我 们 可 以 将 它 和 
之 前 的 s Al 按钮 整合 成 一 组 然后 连接 到 同一 个 输入 端口 。 












Instruction read_strobe 


Interrupt_ack 
address 
KCPSM3 











图 17-9 UART LO 接口 


17.5.3 汇编 代码 开发 


由 于 之 前 汇编 代码 是 以 模块 的 方式 进行 开发 ， 我 们 可 以 通过 在 汇编 代码 中 增 
添 子 程序 prco-uart 的 方式 来 实现 UART 传输 的 功能 。 主 程序 变 为 
call init;initialization 
forever: 
;main loop body 
call proc_btn;check & process buttons 
call proc_uart;check & process uart rx 
call square; calculate square 
call load_led_pttn; store led patterns to ram 
call disp led;output led pattern 
jump forever 
由 于 控制 台 操 作 较 为 复杂 ,proc_uart 程序 也 会 比较 复杂 。 其 伪 代 码 如 下 : 
; if (no character in UART receiving FIFO) then 


š return 
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序 。 


; input characters from FIFO 
; if (characters is a) then 

; input switch value 

; store it to data ram 

; display prompt 

; return 

; if (characters is b) then 

; input switch value 

; store it to data ram 

; display prompt 

; return 

; if (characters is c) then 

; perform initialization 

Н return 

; if (characters is d) then 

; dump data ram 

š return 

; display error message 

р return 

我 们 遵循 模块 化 开发 的 原则 ， 可 以 进一步 将 本 程序 细 化 为 几 个 简单 的 子 程 
一 个 重要 的 底层 子 程序 是 tx-one-byte 子 程序 。 其 功能 为 通过 UART 端口 发 送 


1 字 节 数据 ， 代 码 如 下 : 


;input port definitions 

constant rd flag port,00 

; 4 flags ( xxxxxtrsc ) : 

; t:uart tx full, r: uart rx not empty 

; s: s button flag, c: c button flag 
;output port definitions 

constant uart tx port ,04 ; uart receiver port 
;register alias 


namereg sd,tx data;data to be tx by uart 


tx one byte: 
input s6,rd flag port 
test s6 ,08 ;check uart. tx full 
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jump nz,tx one byte;yes, keep on waiting 
output tx data,uart tx port;no, write to uart tx fifo 
return 
因为 PicoBlaze 处 理 速 度 远 远 高 于 UART 的 发 送 速 度 ， 我 们 必须 防止 buffer 上 
溢 。 本 子 程序 会 持续 判读 发 送 FIFO buffer 的 状态 ， 只 有 在 buffer 不 满 时 才 向 其 写 
入 数据 。 
显示 数据 КАМ 需要 的 工作 量 最 大 ， 将 数据 RAM 的 地 址 和 内 容 显示 为 一 个 8 
行 8 列 的 表格 首先 列 出 字 节 的 地 址 ， 接 着 以 十 六 进 制 的 方式 给 出 8 字 节 数据 ， 如 
T: 
001000 00 OF 00 09 00 04 00 03 
010000 00 00 FF 1D 00 00 00 19 
111000 00 00 00 00 00 FF FF FF 
本 程序 包括 3 个 主要 的 子 程序 : dispram-addr， 用 于 发 送 ASCII 码 以 二 进 制 
方式 显示 5bit 基地 址 ; disp_ram_data， 用 于 发 送 ASCI 码 显 示 8 字 节 数据 ;hex_ 
to_ascii， 将 一 个 十 六 进 制 数 转换 为 相应 的 ASCII 码 。 
完整 的 代码 在 示例 17.3 中 给 出 ， 并 包括 详细 的 注释 来 解释 子 程序 的 操作 。 
示例 17. 1 中 未 更 改 的 子 程序 会 被 忽略 。 
示例 17.3 包含 一 个 UART 控制 台 的 二 次 方 计算 程序 


;program operation : 

; -read a and b from switch 

; -calculate a * a +b * b 

; -display data on HyperTerminal and 7-seg led 


;selected ASCII codes 
constant ASCII 0,30 
constant ASCII 1,31 
constant ASCII 2,32 
constant ASCIL 3,33 
constant ASCII. 2,61 
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constant ASCII_b ,62 

constant ASCII_c ,63 

constant ASCII_d ,64 

constant ASCII o,6F 

constant ASCII r,72 

constant ASCII_E ,45 

constant ASCII_S ,53 

constant ASCII_Q,51 

constant ASCII. D U,44 ; uppercase D 
constant ASCII. GT,3E; > 

constant ASCII SP,20;space 

constant ASCII. CR ,0D ; carriage return 
constant ASCII. LF,0A ;line feed 


——————————————— BM ÍÀQ€ pen ces sed EET et em ee EE cis ps S 


constant a_Isb ,00 
constant b_Isb ,02 
constant aa. lsb ,04 
constant aa, msb. 05 
constant bb_Isb ,06 
constant bb. msb. 07 
constant aabb lsb ,08 
constant aabb_msb. 09 
constant aabb. cout, 0A 
constant ledO ‚10 
constant led1 ‚11 
constant led2 ‚12 
constant led3 , 13 


;commonly used local variables 
namereg s0 , data ;reg for temporary data 


namereg sl ,addr;reg for temporary mem & i/o port addr 
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namereg s2 ‚1; general-purpose loop index 
;global variables 
namereg sc switch a b;ram offset for current switch input 


namereg sd,tx data;data to be tx by uart 


definitione e Ul. u lll ul. u. u... eee 

constant rd_flag_port ,00 

;4 flags ( хххххітѕс) : 

; t:uart tx full 

; r;uart rx not empty 

; S: s button flag 

; €: c button flag 

constant sw. port ,01 ;8-bit switchs 

constant uart rx. port ,02 ;uart recelver port 

constant mult prodO port,03 ; multiplication product 8 LSBs 

constant mult. prodl port,04 ; multiplication product 8 MSBs 

和 output port 
definitions----------------------------------------------------- 

constant sseg0_port ,00;7-seg led 0 

constant ssegl port,01;7-seg led 1 

constant sseg2 port ,02;7-seg led 2 

constant sseg3. port ,03 ;7-seg led 3 

constant uart tx port,O4 ;uart receiver port 

constant mult srcÜ port,05 ; multiplier operand 0 


constant mult srcl port,06 ; multiplier operand 1 


417% PicoBlaze VO 接口 . 499 - 





; -tx_prompt 

; tx_one_byte 
; -proc_btn 

A -init 


; -proc_uart 


; -tx_prompt 

; -init 

5 -proc_uart_err 
З -tx_one_byte 
; -dump_mem 

; -tx_prompt 


] -disp_ram_addr 
-tx_one_byte 

; -get upper nibble 
; -get_lower_nibble 
; -hex_to_ascii 

; -square 

; -mult_hard 

; -load_led_pttn 

; -get lower nibble 

; -get_upper_nibble 

; -hex_to_led 


; -disp led 


call init ; initialization 
forever: 
;main loop body 
call proc. Ып; check & process buttons 
call proc uart;check & process uart rx 
call square;calculate square 
call load. led. pttn;store led patterns to ram 
call disp. led ;output led pattern 


jump forever 
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;routine; init 
; function; perform initialization, clear register/ram 
; Output register: 
; switch a b; cleared to 0 
; temp register; data,i 
init; 
;clear memory 
load 1,40; unitize loop index to 64 
load data ,00 
clr_mem_loop; 
store data, (i) 
sub I,01 ;dec loop index 
jump nz,clr_mem_loop;repeat until i 20 
;clear register 
load switch_a_b ,00 
call tx_prompt 


return 


;routine; proc_uart 

; function; read uart input char: 

; a or b: read a or b from switch; 

; c: clear; d: dump/display data ram other: error 
; input reg: s3( input port flag) 

; temp register used; data 


; s4; store received uart char or 00( по uart input) 


proc uart:; 
test 53 „04; check uart rx status 
jump z,uart rx done;go to done if rx empty 
; process received char 
input s4, uart_rx_port; get char 
;check if received char is a 
compare s4, ASCII_a;check ASCII a 


jump nz,chk_ascii_b;no, check next 
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input data ,sw_port;get switch 
store data,a lsb; write a to data ram 
call tx prompt; new prompt line 
jump uart. rx. done 

chk ascii b: 
;check if received char is b 
compare 54 , ASCII b;check ASCII b 
jump nz,chk ascii c;no,check next 
input data,sw port;get switch 
store data,b. lsb;write b to data ram 
call tx prompt ;new prompt line 
jump uart. rx done 

chk ascii c: 
;check if received char is c 
compare s4 , ASCII_c;check ASCII с 
jump nz,chk ascii d;no check next 
call init; clear 
jump uart_rx_done 

chk ascii d: 
;check if received char is d 
compare s4 , ASCII_d;check ASCII d 
jump nz,ascii undefined 
call dump. mem ; dump/display ram 
jump uart. rx done 

ascii. undefined 
;undefined char 
call proc uart. error 

uart rx. done: 


return 


;routine; proc uart error 


; function; display" Error" for unknown uart char 


proc uart error; 


load tx. data, АЅСП ТЕ 
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call tx one byte;transmit LF 
load tx data, ASCII_CR 

call tx one byte;transmit CR 
load tx. data, ASCII. SP 

call tx one. byte;transmit SP 
call tx_one_byte ; transmit SP 
load tx. data, ASCII_E 

call tx one. byte ; transmit E 
load tx data, ASCII_r 

call ix one byte $ transmit r 
load tx. data, ASCII_r 

call tx one byte ; transmit r 
load tx. data, ASCII_o 

call tx one byte;transmit o 
load tx data, ASCII r 

call tx one. byte ; transmit r 
call tx prompt 

return 


;routine; dump. mem 

; function; when d received, dump 64 bytes of ram as 
; 001000 XX XX XX XX XX XX XX XX 

; 010000 XX XX XX XX XX XX XX XX 


; 111000 XX XX XX XX XX XX XX XX 
; temp register used: - 

; s3; as outer loop index 

; 54; ram base address 


s<======================================================= 


dump_mem: 

load s3 ,00; addr used as loop index 
dump loop: 

;loop body 
load 54, 53 ; веі ram base addr( xxx000 ) 
s10 54 
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510 54 

510 54 

call disp_ram_addr 

call disp_ram_data 

add s3 ,01;іпс loop index 

compare s3 , 08 

jump nx,dump_loop;loop not reach 8 yet 
call tx prompt;new prompt 


retum 


;routine; tx prompt 
; function; generate prompt "SQ >” 


; temp register; tx data 


ix prompt: 
load tx data, ASCII. ТЕ 
call tx one byte ; transmit LF 
load tx data, ASCII. CR 
call tx one byte;transmit CR 
load tx. data, ASCII S 
call tx one byte;transmit S 
load tx data, ASCII_Q 
call tx one byte;transmit Q 
load tx. data, ASCII GT 
call tx one byte;transmit » 
load tx. data, ASCII. SP 
call tx ont. byte;transmit SP 


return 


;routine;disp ram addr 

; function; display 6-bit ram addr 
; bbb000 

; input register; 

; s4; base address 


; temp register; 
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31,87; 1-bit mask 
disp_ram_addr; 
;new line 
load tx. data, АЅСП ТЕ 
call tx one byte;transmit LF 
load tx data, АЅСП_ CR 
call tx one. type;transmit CR 
load tx. data, ASCII_SP 
call tx one byte;transmit SP 
call tx one byte;transmit SP 
;initialize the loop index and mask 
load 1,06; адаг used as loop index 
load s7 ,20 ;set mask to 0010. 0000 
tx loop: 
;loop body 
load tx data, ASCII 1;load default ASCII 1 
test s7 , sd ; check the bit 
jump nz,tx 01 ;the bit is 1 
load tx. data, ASCII_0;the bit is 0 ,Іоаа ASCII 0 
tx 0l: 
call tx one. byte;transmit the ASCII 1 or 0 
;update loop index and mask 
50 s7 ; shift mask bit 
sub 1,01; дес loop index 
jump nz,tx loop;loop not reach 0 yet 
;done with loop,send ASCII space 
load tx. data, ASCII_SP;load ASCII SP 
call tx one byte;transmit SP 


return 


;routine;disp ram data 
; function; 8-byte data in form of 
; 00 11 22 33 44 55 66 77 88 


; input register: 
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; 54; ram base address( xxx000 ) 
; temp register: , addr, data 
disp. ram data: 

;initialize the loop index and mask 

load 1,08 ;addr used as loop index 
d ram loop: 

;loop body 

load addr,s4 

add addr,i 

sub addr,01 ;calculate addr offset 

;send upper nibble 

fetch data, ( addr) 

call get upper. nibble 

call hex. to. ascii ; convert to ascii 

load tx. data , data 

call tx one, byte 

;send lower nibble 

fetch data, ( addr) 

call get_lower_nibble 

call hex_to_ascii;convert to ascii 

load tx_data, data 

call tx_one_type 

;send a space 

load tx data, ASCII_SP; 

call tx one byte;transmit SP 

sub i,01 ; dec loop index 

jump nz,d ram loop;loop not reach 0 yet 

return 
;routine: hex to ascii 
; function; convert a hex number toascii code 
; add 30 for 0-9, add 37 for A-F 
; input register: data 
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hex to ascil: 
compare data ,0a 
jump c,add 30;0 to 9, offset 30 
add data ,07 ;a to f,extra offset 07 
add 30; 
add data ,30 
return 


;routine; tx one byte 

; function; wait until uart tx fifo not full; 
; then write a byte to fifo 

; input register; tx data 

; temp register; 

; s6: read port flag 


tx_one_byte: 
input s6,rd flag port 
test s6 ,08 ; check uart. tx. full 
jump nz,tx one byte;yes, keep on waiting 
output tx data,uart tx port;no,write to uart tx fifo 
return 


;routine; square 

; function; calculate a * a +b * b 

; data/result stored in ram started w/SQ BAST ADDR 
; temp register; s3,s4,s5 ,s6 , data 


square ; 
;calculate a * a 
fetch 53 ,a_Isb;load a 
fetch s4,a_Isb;load a 
call mult_hard; calculate a * a 
store s6 ,aa_lsb ; store lower byte of a * a 
store 55 ,aa_msb;store upper byte of a * a 


;calculate b * b 
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fetch 53 ,Ь Isb;load b 

fetch s4,b_Isb;load b 

call mult, hard ; calculate b * b 

store s6,bb lsb;store lower byte of b * b 

store s5,bb msb;store upper byte of b * b 
;calculate a * a +b b 

fetch data,aa lsb;get lower byte of a * a 

add data,s6;add lower byte of a * a +b b 

store data, aabb lsb;store lower byte of a *a +b * b 
fetch data,aa msb;get upper byte of a * a 

addey data,s5 ;add upper byte of a *a +b * b 

store data, aabb msb;store upper byte of a * a +b * b 
load data ,00;get carry from previous 

store data, aabb_cout;store carry of a * a +b * b 


return 


;routine ; mult hard 


, 
, 


, 


, 


function; 8-bit unsigned multiplication using 
external combinational multiplier; 

input register; 

s3; multiplicand 

54: multiplier 
output register: 

s5: upper byte of product 

36; lower byte of product 


temp register: 


mult. Бага; 


output s3, mult srcÜ port 
output s4, mult srcl port 
input s5 , mult prodl port 
input s6, mult prodO port 


return 


;The following are the same as the previous listings : 
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; proc btn, load led pttn, disp led 
; hex to led, get lower nibble, get upper nibble 


17.5.4 HDL 代码 开发 


新 的 二 次 方 电路 向 VO 接口 添加 了 一 个 UART 和 一 个 组 合 乘法 器 。 前 者 即 为 
8.4 节 中 讨论 的 模块 ， 后 者 可 以 通过 HDL 的 “* ”运算 符 导出 。 示 例 17. 2 中 
HDL 代码 的 解码 和 多 路 选择 部 分 可 以 被 扩充 来 包含 两 个 新 的 外 设 。 完 整 的 HDL 
代码 在 示例 17.4 中 显示 。 详 细 的 L/O 端口 地 址 分 配 可 以 在 之 前 一 个 章节 (17.3 
节 ) 中 找到 。 

示例 17.4 包括 UART 控制 台 和 乘法 器 接口 的 PicoBlaze 


module pico uart 
( 
input wire clk , reset , 
input wire[ 7:0] sw, 
input wire rx, 
input wire[ 1 :0 ] btn, 
output wire tx, 
output wire[ 3:0] an, 
output wire[ 7:0 | sseg 
); 
// 信号 声明 
// KCPSM3/ROM 信号 
wire[ 9:0] address; 
wire[ 17:0] instruction; 
wire[ 7:0] port id,out port; 
reg[ 7:0] in port; 
wire write strobe,read strobe; 
/IO 端口 信号 
// 输出 使 能 
reg[6:0] en d; 
//4 位 7 BLED 显示 
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reg[ 7:0] ds3_reg,ds2_reg,dsl_reg, dsO_reg; 
// 两 个 按 知 

reg btnc flag reg,btns flag reg; 

wire Ыпс_ flag next,btns flag next; 

wire set. btnc flag,set btns flag,clr btn flag; 
// uart 

wire[ 7:0] rx char; 

wire rd. uart,rx not empty,rx empty; 

wire wr uart,tx full; 

// FER 

reg[ 7:0] m srcÜ reg,m srcl reg; 

wire[ 15:0] prod; 

// 实体 


disp. mux disp. unit 
(. elk( clk) ,. reset( reset) , 
. in3 (ds3_reg) ,. in2(ds2 reg) ,. inl (dsl reg), 
. inO( ds. reg) ,. an(an) ,. sseg(sseg) ) ; 
debounce btnc unit 
(. elk( elk) ,. reset( reset) ,. sw( btn[0]) , 
. db level( ) ,. db. tick(set. btnc flag) ) ; 
debounce btns, unit 
(. elk( clk) ,. reset( reset) ,. sw( btn[1]) , 
. db level( ) ,. db. tick(set btns flag) ) ; 
uart uart. unit 
(. elk( clk) ,. reset( reset) ,. rd uart(rd uart) , 
. wr. uart( wr uart) ,. rx(rx) , 
. w. data( out. port) ,. tx_full( tx_full) , 
. rx empty(rx empty) ,. r data( rx char) ,. tx(tx) ) ; 
// t ЖЖ 


assign prod 2 m srcÜ reg * m srcl reg; 


// KCPSM 和 ROM 实例 
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kcpsm3 proc unit 
(. elk( elk) ,. reset( 1 ' b0) ,. address( address), 
. instruction( instruction) ,. port. id( port. id) , 
. write strobe( write strobe) ,. out. port( out port), 
. read. strobe( read strobe) ,. in. port(in port), 
. interrupt( 1 ' bO) ,. interrupt. ack( ) ) ; 
uart rom rom unit 
(. elk( clk) ,. address( address ) , 


. instruction ( instruction  ) ; 


// ў id : 

// 0x00 ; 450 

// 0x01 : dsl 

// 0x02: ds2 

// 0x03 ; ds3 

// 0x04 :art tx fifo 
// 0x05 : m ѕгс0 
// 0x06 : m srcl 


// SERE 
always @ ( posedge clk) 
begin 
if( en d[0]) 
ds0 reg < -out port; 
if( en. d[1]) 
dsl reg < = out port; 
if( en d[2]) 
ds2 reg < = out port; 
if( en d[3]) 
ds3 reg < -out port; 
if(en d[5]) 


m srcÜ reg < -out port; 
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if( en d[6]) 
m src] reg < —out port; 
end 
// RA ВАН Bb TG > 
always @ * 
if( write strobe) 
case( port, id[ 2:0] ) 
3’ b000: en d =7’ b0000001 ; 
3' b001; en d =7’ b0000010; 
3' b010: en d =7’ b0000100; 
3' b011: en d =7’ b0001000; 
3' b100: en d =7’ b0010000; 
3' bl01 : en d =7’ b0100000; 
default; en d =7’ b1000000; 
endcase | 
else 
en d =7’ d0000000 ; 


assign wr_uart zen d[4]; 


// Ж A ig E id 

// 0x00 ; flag 

// 0x01 : switch 

// 0x02 :пагі тх_ о 

// 0x03 ; prod lower byte 
// 0x04 : prod upper byte 


// B A PETERE 
always € ( posedge clk) 
begin 
btnc flag reg < = Ыпс flag next; 
btns flag reg < = btns flag next; 
end 


assign btne flag next = (set btne flag) ? 1” bl; 
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(clr_btn_flag) ? 1'b0; 
btnc flag reg; 
assign btns flag next = (set btns flag) ? 1’ bl; 
(clr_btn flag) ? 1’ b0; 
btns flag reg; 
// fi YEE OT ES EHS Р} 
assign clr_btn_flag = read_strobe && (port id[2:0] = =3’ b000) ; 
assign rd_uart = read_strobe && ( port id[2:0] = =3’ b010); 
// 得 人 多 收复 用 
assign rx not empty = ~ rx_empty; 
always @ * 
case( port id[ 2:0] ) 
3' b000: in. port = | 1' bO,tx full,rx not empty, 
btns flag reg,btne flag тее}; 
3' b001 ; in port = sw; 
3” b010:in. port = rx. char; 
3' bO11 ;in_port = prod[7:0] ; 
default ; in port = prod[ 15:8] ; 
endcase 


endmodule 


17.6 文献 备注 


本 章 的 文献 备注 信息 同 第 15 章 相似 。 下 载 的 kepsm 文件 中 包含 一 个 完整 的 
UART 例子 和 一 个 定时 器 设计 例子 。Xilinx 网 站 上 有 关于 “PicoBlaze 讨论 ”和 
“PicoBlaze 用 户 资 源 ” 的 专栏 ， 其 中 有 更 丰富 的 PicoBlaze 例子 。 


17.7 实验 


17.7.1 低频 计数 器 I 


精确 的 低频 计数 器 在 6.3. 5 节 中 已 经 讨论 过 。 我 们 可 以 将 周期 计数 器 、 分 频 
电路 和 二 进 制 到 十 进 制 的 转换 电路 视 为 3 个 VO 模块 ， 并 用 PicoBlaze PRIUS 
状态 机 。 设 计 VO 接口 ， 进 行 汇编 代码 和 HDL 代码 设计 ， 编 译 并 综合 电路 ， 验 
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证 其 功能 。 
17.7.2. 低频 计数 器 H 


我 们 可 以 利用 软件 子 程序 去 替代 17.7.1 市 频率 计数 器 中 分 频 电 路 和 二 进 制 
到 十 进 制 转换 电路 的 硬件 。 重 新 设计 VO 接口 ， 进 行 汇编 代码 和 HDL 代码 设计 ， 
编译 并 综合 电路 ， 验 证 其 功能 。 


17.7.3 自 适 应 低频 计数 器 


实验 6.5.5 中 讨论 了 一 个 自 适 应 低频 计数 器 。 我 们 可 以 利用 PicoBlaze 去 实 
现 所 有 非 时 间 人 敏感 功能 。 结 合 PicoBlaze 重新 设计 电路 ， 最 小 化 外 围 硬件 。 进 行 
汇编 代码 和 HDL 代码 设计 ， 编 译 并 综合 电路 ， 验 证 其 功能 。 


17.7.4 利用 软件 定时 器 替代 基础 反应 定时 器 


实验 6.5. 6 讨论 过 反应 定时 器 ， 现 在 我 们 可 以 利用 PicoBlaze 重新 设计 这 个 
电路 。 首 先 需要 记录 过 去 的 时 间 间 隔 ， 这 个 可 以 由 一 个 软件 计数 器 子 程序 来 实 
现 。 原 型 开发 板 上 的 时 钟 为 50MHz， 每 一 个 指令 需要 耗费 两 个 时 钟 周期 。 建 立 
有 一 个 计数 循环 来 记录 指令 执行 的 次 数 ， 并 据 此 得 出 时 间 间 隔 。 因 为 间隔 至 少 是 
ms 级 ， 因 此 需要 使 用 多 个 寄存 器 。 设 计 IO 接口 ， 进 行 汇编 代码 和 HDL 代码 设 
计 ， 编 译 并 综合 电路 ， 进 行 功 能 验证 。 


17.7.5 包含 硬件 定时 器 的 反应 定时 器 


我 们 可 以 利用 一 个 定制 的 硬件 定时 器 来 重 做 17.7.4 节 中 的 实验 。 定 时 器 应 
被 视 为 一 个 IO 外 设 。PicoBlaze 可 以 通过 输出 一 个 命令 去 清空 、 起 动 或 暂停 定 
时 器 ， 并 可 以 获取 定时 器 的 当前 值 。 设 计 LO 接口 ， 进 行 汇编 代码 和 HDL 代码 
设计 ， 编 译 并 综合 电路 ， 并 进行 功能 的 验证 。 


17.7.6 增强 型 反应 定时 器 


一 个 改进 的 反应 定时 器 可 以 记录 最 近 的 四 次 响应 时 间 、 最 快 的 响应 时 间 ， 并 
能 在 Windows 的 超级 终端 上 显示 以 上 这 些 数据 。 我 们 可 以 设计 一 个 类 似 于 17. 5 
节 的 控制 台 ， 这 里 需要 有 3 个 命令 : 

e c: 清空 所 有 的 数据 。 

e f: 显示 最 快 的 响应 。 

e r; 显示 最 近 的 四 次 响应 时 间 。 

e 其 他 的 字符 : 显示 “error” o 

扩展 17.7.4 TERI 17. 7. 5 节 中 的 设计 来 实现 该 功能 。 设 计 IO 接口 ， 进 行 汇 
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编 代 码 和 HDL 代码 设计 ， 编 译 并 综合 电路 ， 进 行 功能 验证 。 
17.7.7 小 屏幕 鼠标 跟踪 电路 


13. 7. 10 节 讨 论 过 小 屏幕 鼠标 跟踪 电路 的 设计 。 我 们 可 以 利用 PicoBlaze 去 监 
控 鼠 标的 动作 并 更 新 相关 的 影像 内 存 。 设 计 YO 接口 ， 进 行 汇编 代码 和 HDL 代 
码 设计 ， 编 译 并 综合 电路 ， 进 行 功 能 验证 。 


17.7.8 全 屏幕 鼠标 跟踪 电路 


13. 7. 11 节 中 讨论 过 一 个 全 屏幕 数 饥 跟踪 电路 ， 这 里 我 们 可 以 用 PicoBlaze 去 
监控 鼠标 的 动作 并 更 新 相关 的 影像 内 存 。 设 计 VO 接口 ， 进 行 汇编 代码 和 HDL 
代码 设计 ， 编 译 并 综合 电路 ， 进 行 功能 验证 。 


17.7.9 增强 型 跑马 灯 字 幕 


14. 6. 1 节 中 讨论 过 VGA 跑马 灯 字 幕 的 电路 设计 。 我 们 可 以 通过 使 用 键盘 答 
和 方向 信息 的 方式 增强 电路 的 性 能 。 假 定 信息 buffer 有 20 个 字符 长 ， 其 字符 更 
新 依据 先入 先 出 的 方式 。 使 用 PicoBlaze 重新 设计 电路 。 设 计 VO 接口 ， 进 行 汇 
编 代码 和 HDL 代码 设计 ， 编 译 并 综合 电路 ， 进 行 功能 验证 。 


17.7.10 乒乓 游戏 


14. 4 节 中 乒乓 游戏 的 部 分 功能 可 以 通过 PicoBlaze 来 实现 : 
© 顶层 控制 状态 机 。 
e 顶层 2s 定时 器 和 两 位 数 十 进 制 计数 器 。 
。 示 例 13.5 用 于 更 新 弹 板 位 置 ， 球 的 位 置 以 及 球 的 速率 。 
更 改 之 前 的 电路 ,设计 UO 接口 ， 进 行 汇编 代码 和 HDL 代码 设计 ， 编 译 并 
综合 电路 ， 进 行 功能 验证 。 


17.7.11 文本 编辑 器 


14.6.5 节 的 实验 讨论 了 一 个 UART 终端 我 们 可 以 用 PicoBlaze 去 通过 
UART 获取 数据 和 命令 ， 从 而 更 新 存储 块 。 设 计 VO 接口 ， 进 行 汇编 代码 和 HDL 
代码 设计 ， 编 译 并 综合 电路 ， 进 行 功能 验证 。 


第 18 章  PicoBlaze +! {#11 


18.1 简介 


在 程序 正常 运行 的 过 程 中 ， 微 处 理 器 负责 通过 IO 设备 (例如 检查 状态 信 
号 ) ， 以 及 决定 下 一 步 正确 的 运行 进程 。L0 设备 只 是 被 动 地 等 待 该 它 运行 的 时 
刻 。 中 断 是 一 种 允许 VO 设备 开始 运转 的 信号 机 制 。 就 像 这 名 字 一 样 ， 中 断 是 一 
个 常规 的 可 执行 的 程序 ， 用 来 开启 VO 设备 的 服务 行程 。 对 于 一 个 微 处 理 器 来 
说 ， 中 断 常常 用 于 一 些 对 时 间 因 素 要 求 很 高 的 外 围 设 备 操作 ， 遇 到 危急 时 刻 ， 中 
断 可 以 立即 执行 。PicoBlaze 微 处 理 器 就 具有 提供 简单 的 中 断 操作 的 性 能 。 在 本 
章 中 ， 我 们 要 检查 这 个 PicoBlaze 的 中 断 机 制 ， 以 及 举例 说 明 软件 和 接口 技术 的 
发 展 。 


18.2 PicoBlaze 里 的 中 断 操作 


中 断 操作 在 硬件 和 软件 里 的 重要 性 是 一 致 的 。 当 一 个 外 部 设备 需要 通过 中 断 
来 运行 ， 它 就 声明 PicoBlaze 中 断 信 号 。 如 果 这 个 中 断 信号 是 可 执行 的 ，PicoB- 
laze 就 执行 当前 指令 ， 使 得 中 断 命令 信号 接收 中 断 请 求 ， 然 后 就 自动 执行 地 址 
3FF 寄存 器 的 指令 。 当 这 条 指令 被 执行 了 ， 当 前 的 程序 进度 被 保存 在 堆栈 里 ， 地 
址 3FF 也 被 导入 程序 进度 里 。 注 意 ， 这 个 3FF 地 址 是 最 后 一 个 指令 寄存 器 的 地 
址 ， 也 是 开始 指向 中 断 服务 程序 的 地 址 。 它 通常 包含 一 个 跳 变 指令 ， 引 导 服 务 程 
序 的 主体 。 当 一 个 反馈 指令 执行 使 得 进程 返回 到 中 断 处 ， 继 续 执行 之 前 被 中 断 的 
进程 的 时 候 ， 中 断 服务 在 此 时 就 结束 了 。 


18.2.1 软件 处 理 


4 个 指令 是 和 中 断 相 关联 的 ， 这 在 15.5.9 节 已 讨论 过 。 中 断 使 能 以 及 禁止 
中 断 指令 可 以 许可 或 禁止 中 断 请 求 。 这 两 种 相反 的 中 断 指令 ， 执 行 之 后 都 会 返回 
到 中 断 点 。 

图 18-1 是 一 个 典型 的 中 断 服务 程序 流程 图 。 它 通常 包含 如 下 部 分 : 

e 一 个 初始 化 的 中 断 使 能 指令 ， 用 来 允许 中 断 服 务 ， 这 个 是 必须 的 ， 因 为 默 
认 的 中 断 请 求 是 处 于 无 效 状态 ; 
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forever: 
enable interrupt 


——|—-— . adds0,3 
sub 55,01 









call critical timing 
jump forever 
.=== time critical segment === 
critical timing: 
disable interrupt 


enable interrupt 
return 


¿=== interrupt service routine == 


isr: 


М test 52,01 


4 


М returni enable 
3 


; === interrupt véctor === 
address 3FF 
jump isr 
图 18-1 中 断 的 流程 图 


e 一 个 轻 升 指令 在 指令 寄存 器 的 末端 (例如 3FF): 触发 中 断 服务 程序 ; 

e 中 断 服务 程序 : 这 个 代码 实际 上 执行 的 是 被 请 求 的 服务 ， 这 个 程序 应 该 被 
Hik, 用 一 个 回馈 指令 。 

中 断 事件 的 代表 性 流程 图 如 图 18-1 所 示 。 我 们 假定 这 个 外 部 的 VO 接口 断 
定 中 断 信号 在 增加 的 SO, S3 指令 的 中 间 。PicoBlaze 按 顺序 执行 以 下 各 步骤 : 

1) 完成 当前 执行 ; 

2) 保留 程序 数 的 进程 ， 清 理 中 断 标记 i 为 0， 实 现 0 保护 和 达到 标记 点 ， 从 
3FF 里 读 取 程 序数 ; 

3) 在 地 址 3FF 里 执行 跃升 中 断 服务 程序 指令 ; 

4) 执行 服务 程序 ; 
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5) 执行 反馈 指令 ， 复 原 被 保存 的 程序 进程 和 标记 点 ; 
6) 继续 执行 中 断 程序 ， 执行 S5、01 指令 


18.2.2 ЕА 


之 前 的 中 断 事件 的 详细 时 序 图 如 图 18-2 所 示 。 基 本 的 顺序 是 : 
e 在 tl 时刻， 外 部 的 中 断 接口 生成 中 断 信 号 ，PicoBlaze 继续 正常 的 操作 ， 
完成 执行 当前 增加 指令 80, 53; 
@ 在 也 时 刻 ，PicoBlaze 认可 中 断 ， 使 得 下 一 个 指令 失效 (S5，01) ， 间 接 执 
413FF 的 指令 ; 
efr 13 时刻，PicoBlaze 发 出 中 断 命令 正确 应 答 信 号 ， 它 也 保存 了 so, 01 指 
令 的 地 址 ， 实 现 0 保护 和 传送 标记 ， 清 理 中 断 标记 为 0; 
ө FE 4 Al, PicoBlaze 加 载 执行 ЗЕЕ 地 址 里 的 指令 ， 跳出 中 断 服务 程序 ， 
外 部 中 断 接 口 依次 对 中 断 命令 正确 应 答 信 号 做 出 反馈 ， 回收 中 断 信号 ; 
e fr 15 时刻，PicoBlaze 开始 中 断 服务 程序 。 
tl t2 t3 № t$ 
clk 
address 
interrupt 


interrupt_ack 





该 指令 被 抢占 ， 
并 隐 式 执行 “call3FF” 
图 18-2 一 个 中 断 时 间 的 时 序 图 
注意 ， 它 需要 5 个 时 钟 周期 ， 从 中 断 信号 发 出 时 刻 起 ， 到 第 一 个 中 断 服务 指 
令 被 执行 为 止 。 


18.3 ”外 部 接口 


中 断 请 求 的 本 质 类 似 于 在 17.3.2 节 里 论述 的 信号 通路 端口 。 当 请 求 被 接受 
的 时 候 ， 它 必须 被 清理 掉 ， 防 止 相同 的 请 求 被 多 次 执行 。 在 8. 2. 4 节 论 述 的 标记 
点 FF 可 以 被 用 来 达到 这 个 目的 。 


18.3.1 中 断 请 求 信号 
如 果 在 PicoBlaze 系统 里 只 有 一 个 外 围 的 VO 接口 的 话 ， 那 就 可 以 产生 一 个 
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中 断 请 求 ， 我 们 只 需要 一 个 标记 触发 器 在 中 断 接 口 周期 ， 如 图 18-3 所 示 。 当 需 
要 这 个 服务 的 时 候 ， 外 部 IO 接口 电路 发 出 一 个 时 钟 周期 的 int 请 求 信 号 ， 把 特 
征 位 触发 器 设置 为 1， 激 活 PicoBlaze 的 中 断 输 入 。 如 果 PicoBlaze 的 中 断 是 被 许 
可 的 ， 发 出 一 个 时 钟 周期 的 中 断 命 令 正 确信 号 ， 来 接收 这 个 请 求 ， 把 特征 位 触发 
器 清 零 。 









int request 





TISITHERIOTI write strobe 





interrupt interrupt ack 





address 





KCPSM3 





图 18-3 一 个 中 断 请 求 信号 的 接口 


18.3.2 多 重 中 断 请 求 


-处理 一 个 有 两 个 中 断 请 求 以 上 的 PicoBlaze RAM EPF, PicoBlaze 的 微 处 
理 器 必须 确定 究竟 是 哪 一 个 外 部 设备 发 出 的 中 断 请 求 以 及 在 完成 中 断 请 求 后 清除 
掉 相 应 的 标记 触发 器 。 这 需要 外 部 硬件 接口 以 及 中 断 服 务 程序 的 协调 操作 。 

中 断 接 口 的 两 个 请 求 ， 如 图 18-4 所 示 。 这 两 个 独立 的 请 求 ， 标 准 请 求 0 和 
标准 请 求 1， 和 两 个 标记 触发 器 相 联系 ， 和 触发 器 是 输出 信和 号 被 传递 给 产生 最 终 中 
断 请 求 信号 的 门 器 件 。 除 此 之 外 ， 这 两 个 信和 号 也 发 送 到 多 路 输入 器 。 如 果 至 少 有 
一 个 请 求 等 待 执行 ，PicoBlaze 的 中 断 信和 号 就 发 出 了 。 当 PicoBlaze 察觉 到 这 个 请 
求 ， 它 不 知道 到 底 是 哪个 外 围 设备 ， 或 者 是 几 个 外 围 设备 一 起 发 出 的 这 个 请 求 。 
这 个 中 断 服务 程序 必须 首先 输入 这 两 个 请 求 信号 ， 然 后 检查 它们 的 确切 含义 ， 根 
据 设 定好 的 优先 权 ， 然 后 执行 相应 的 服务 程序 。 


int request 0 








in port out port 
reset port id 

read strobe 
write strobe 















А instruction 
int request 1 





interrupt interrupt ack 
address 
KCPSM3 














Р 18-4 两 个 请 求 的 中 断 接口 
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除 此 之 外 ，PicoBlaze 也 需要 清理 相应 的 标记 触发 器 ， 这 个 中 断 正 确 指令 信 
号 不 能 被 用 来 达到 这 个 目的 ， 因 为 它 不 知道 到 底 哪 一 个 外 围 设 备 的 请 求 是 被 接收 
的 ， 当 中 断 正确 指令 信和 号 发 出 后 。 我 们 可 以 这 样 ， 我 们 需要 用 一 个 特殊 的 输出 解 
码 电路 产生 一 个 清除 记号 。 这 每 一 个 标记 触发 器 的 clr 信号 被 指派 到 唯一 对 应 的 
端口 id。 在 中 断 服 务 程序 里 ， 在 决定 了 哪 一 个 中 断 请 求 被 接收 了 之 后 ,我们 增加 
一 个 输出 指令 。 这 个 指令 不 能 输出 任何 数据 。 它 只 是 用 来 产生 一 个 信号 周期 来 清 
除 相应 的 标记 触发 器 。 

为 了 减少 软件 顶层 构架 ， 加 快 响应 速度 ， 我 们 可 以 设计 一 个 中 断 控 制 器 ， 使 
得 这 个 进程 变 得 更 容易 一 些 。 这 个 方法 将 在 18.7. 5 节 以 试验 形式 讨论 。 


18.4 软件 发 展 描述 


18.4.1 中 断 作 为 一 个 可 选择 的 计划 方案 
回 看 一 款 基 于 微 处 理 器 的 应 用 常常 有 一 套 简单 的 表决 项 目 结构 : 


call initialization routine 
forever: 
call taskl. routine; 


call task2. routine; 


call taskn-routine ; 

jump forever; 

有 些 任 务 也 许 包 括 VO 操作 。 在 执行 期 间 ， 微 处 理 器 按 顺序 检查 L/O 状态 ， 
采取 相应 的 操作 。 这 种 程序 结构 实现 了 环 状 进度 表 ， 每 一 个 任务 都 按 顺 序 等 待 被 
执行 。 这 种 配置 可 以 完全 的 工作 ， 如 果 循 环 间隔 短 到 每 一 个 VO 请 求 都 可 以 被 检 
查 和 在 合适 的 时 间 期 限 内 处 理 。 在 一 些 应 用 里 ， 也 许 存在 一 个 或 两 个 时 间 周 期 的 
LO 请 求 ， 这 就 需要 更 直接 的 关注 。 中 断 机 制 提供 一 种 方式 ， 打 断 初始 的 计划 安 
排 ， 给 一 个 确定 的 后 续 任 务 更 高 的 优先 权 。 

既然 一 个 中 断 可 能 发 生 在 任何 时 间 ， 这 个 原始 闭环 必须 考虑 到 中 断 的 频率 以 
及 被 需求 的 每 个 中 断 请 求 的 服务 时 间 。 当 有 多 个 相关 的 中 断 请 求 或 是 服务 程序 的 
时 候 ， 这 可 能 比较 复杂 。 


18.4.2 ”中断 服务 程序 的 发 展 


中 断 服务 程序 就 好 比 一 个 子 程序 。 它 使 得 正常 的 程序 延缓 ， 执 行 独立 的 任 
务 ， 然 后 恢复 先前 执行 的 程序 。 然 而 和 子 程序 不 同 的 是 ， 中 断 可 能 发 生 在 任何 时 


- 520 - 用 Verilog 设计 FPGA 样机 实例 解析 (Xilinx Spartan-3 版 ) 





间 。 为 了 恢复 先前 执行 的 程序 ， 这 个 服务 程序 必须 保存 PicoBlaze 处 理 器 的 当前 
状态 〈 也 叫做 当前 背景 ) 。 换 名 话说， 这 个 服务 程序 必须 保存 所 有 该 服务 程序 中 
用 于 计算 的 寄存 器 ， 然 后 恢复 它们 ， 在 返回 正常 执行 程序 之 前 。 这 个 进程 被 称 为 
背景 交换 。 

既然 PicoBlaze 是 一 个 简单 的 8 位 微 处 理 器 ， 这 个 背景 交换 的 计划 的 硬件 支持 
也 很 有 限 。 我 们 应 该 用 通用 的 表决 方案 ,保持 中 断 结 构 的 简单 化 和 易 懂 性 。 我 们 可 
以 分 配 用 于 该 服务 的 寄存 器 用 来 专门 服务 于 中 断 服务 程序 ， 而 不 是 担心 背景 交换 。 


18.5 设计 用 例 


第 17 章 用 的 方形 回路 ， 采 用 7 段 式 的 LED 来 显示 输入 的 操作 数 和 结果 。 我 
们 用 预定 的 LED 多 路 技术 模块 达到 显示 的 目的 。 这 种 模块 设计 在 4. 5.1 节 已 经 
讨论 过 ， 它 由 一 个 很 大 的 计数 器 产生 一 个 很 缓慢 的 使 能 脉冲 ， 多 回路 则 为 发 送 模 
Bis 

为 了 节省 硬件 ， 我 们 可 以 在 软件 里 贯彻 这 种 功能 ， 让 PicoBlaze 控制 这 个 4 
位 的 使 能 信号 ，8 位 的 LED 信号 ，4 位 直接 显示 。 为 了 产生 一 个 真实 的 连续 的 样 
本 ， 这 个 使 能 脉冲 和 LED 端口 必须 定期 更 新 ， 这 在 图 4-6 里 有 所 表示 。 用 纯 软 
件 保 留 时 钟 路 径 是 可 能 的 ， 但 这 种 代码 易 错 。 我 们 用 一 个 专门 的 计时 器 硬件 和 
PicoBlaze 的 中 断 设施 来 完成 这 个 任务 。 这 种 硬件 需求 和 软件 更 改 在 下 面 章节 里 
都 有 图 示 。 


18.5.1 接口 中 断 


时 钟 和 接口 中 断 的 阻塞 图 表 ， 也 是 新 的 输出 块 ， 如 图 18-5 所 示 。 计 时 器 是 
一 个 500-mod 的 计时 器 ， 每 隔 500 个 时 钟 周期 产生 一 个 信号 时 钟 周期 。 当 这 
50MHz 的 时 钟 被 用 在 这 个 计时 器 上 的 时 候 ， 这 个 tick 的 周期 是 0.01ms。 因 为 这 
有 唯一 的 中 断 请 求 ， 我 们 用 触发 器 标记 接口 中 断 ， 这 在 18. 3. 1 节 已 讨论 。 这 个 
tick 设置 触发 器 标记 ， 刺 激 PicoBlaze 的 中 断 信号 。 








sseg 





instruction 






interrupt 







interrupt ack an 





address 
KCPSM3 











图 18-5 ”一 个 计时 器 的 中 断 接口 
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18.5.2 中断 服务 程序 的 发 展 


为 了 保留 消逝 时 钟 的 路 径 ，PicoBlaze 就 对 时 钟 周期 进行 计数 。 如 18.4.2 节 
所 讨论 的 ， 我们 希望 保持 这 个 中 断 服务 程序 简单 化 ， 用 两 个 专门 的 寄存 器 : 
count_msb 和 count_Isb 来 完成 这 个 任务 。 这 两 个 寄存 器 是 层 全 的， 作为 一 个 16 
位 的 寄存 器 ， 增 加 每 一 个 中 断 服务 程序 被 响应 的 时 间 。 它 们 可 以 计数 到 0. 6s 的 
精确 度 。 这 里 叙述 的 中 断代 码 片段 如 下 : 

namereg se, count_msb ; timer tick count 8 MSBs 


namereg sf, count_lsb ; timer tick count 8 LSBs 


;interrupt service routine 

Int. service routine: 

add count lsb, 01 ; inc 16-bit counter 
addcy count msb, 00 

returni enable 

;interrupt vector 

address 3FF 


jump int service routine 
18.5.3 集成 代码 的 发 展 


时 序 信息 是 可 用 的 ， 因 此 我 们 可 得 到 一 个 新 的 子 程序 ， 用 LED 来 显示 mux 
— out。 在 第 17 章 中 ， 这 个 程序 代替 显示 LED 的 程序 。 需 要 两 个 新 的 输出 缓冲 器 
来 存储 an 和 sseg 信号 ， 这 在 18. 5 节 有 所 述 叙 。 这 个 子 程序 的 主要 任务 就 是 存储 
这 个 采样 数据 ， 它 可 能 是 1110，1101，1011,，0111， 同 时 ， 相 应 的 七 位 LED W 
示 器 也 模拟 出 周期 性 的 记录 表 。 就 如 4. 5. 1 节 所 述 ， 更 新 频率 应 该 稳定 在 数 百 赫 
效 到 数 千 赫 效 之 间 。 在 我 们 的 代码 里 面 ， 我 们 更 新 这 些 寄 存 器 ， 每 隔 1024 个 周 
期 脉冲 ， 大 致 相当 于 10ms。 我 们 也 可 以 用 一 个 寄存 器 led_ pos 来 跟踪 记录 当前 
显示 排列 ， 例 如 4 个 LED 显示 器 中 的 一 个 。 

为 了 使 得 新 的 中 断 特 点 能 够 融 人 示例 17.3， 使 之 成 为 一 体 化 结构 ， 这 个 代 
码 还 应 该 做 出 如 下 修改 : 

e 增 加 新 的 端口 ， 定 义 新 的 寄存 器 ; 

e 用 display | mux-out 程序 代替 最 初 的 disp-led; 

e 在 内 部 的 程序 里 增加 使 能 中 断 指 示 ， 使 得 中 断 操 作 能 够 执行 ; 

e 在 内 部 程序 里 面 初始 化 led_ pos, count_ msb 以 及 count_ lsb 寄存 器 ; 

e 增 加 中 断 服 务 程序 。 
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示例 18. 1 就 是 部 分 修改 过 的 代码 汇编 。 
示例 18.1 与 中 断 接口 方 的 程序 


:register alias 
namereg sb, led-pos ; led disp position(0, 1, 2 or 3) 
namereg se, count-msb ; timer tick count 8 MSBs 


5  namereg sf, count-lsb ; timer tick count 8 LSBs 


;output port definitions 

constant an. port , 00 

constant sseg port , O1 

10 

;main program 

call init ; initialization 

forever: 

;main loop body 

15 call proc Ып ; chenk & process bottons 
call square ; calculate square 

call load led pttn ; atore led patterns to ram 
call display-mux-out ; multiplex led patterns 


jump forever 


20 


5 enable interrupt 


load led-pos, 00 
load count-msb, 00 
load count-lsb , 00 


30 return 


;routine : display mux out 
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;funtikon ; generate enable pulse & led pattern 
35;  for4-digit 7-segment led display 
;input register ; 

count-msb, count lsb : time count 

led pos : current led position 

;output register: 

40; led pos : updated led position 

;tmp register : data , addr 


Display mux out ; 

compare count msb , 02 ; count 200000100 00000000 
45 jump c , mux-out-done 

;clear time counter( count » 20) 

load count. lsb, 00 

load count. msb, 00 

;update 7-segment led position 

50 add led pos, 01 

compare led pos, 04 

jump nz , gen an signal 

load led pos, 00 ; led pos wraps around 
gen an signal: 

55 ; generate 4 -bit anode enable signal 
load data, OE ;xxxx - 1110 

compare led pos, 00 

jump z, shift an O 

compare led pos, 01 

60 jump z shift an 1 

compare led pos, 02 

jump z,shift an 2 

sll data ; shift 1110 3 tmes 

shift an 2: 

65 sll data ; shift 1110 2 tmes 
shift an 1: 

sll data ; shift 1110 1 tmes 

shift an 0: 
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output data, an_port 

70 : output 7-seg led pattern 

load addr, ledO 

add addr, led-pos 

fetch data, (addr) 

output data, sseg-port 

75  mux_out_done : 

return 

;routine ; interrupt service routine 
80 : function : increment 16 bit counter 
;input register : 

count-msb, count  lsb ; timer count 
:output register : 


count-msb, count, lsb ; incremented 


Int service routine: 

add count. lsb, 01 ; ine 16-bit counter 
addcy count msb , 00 

returni enable 


90 


address 3FF 


95 jump int service routine 


: The following are the same as the previkous listings: 
;proc btn, load led pttn, 

100; hex to led, get lowre nibble, get upper nibble 
;square, mult soft 


jis * 


18.5.4 HDL 代码 的 发 展 
基于 中 断 的 L/O 接口 方形 回路 ， 包 括 3 个 部 分 。 输 入 接口 和 17.4 节 所 述 是 


第 18 # PicoBlaze 中 断 接 口 - 525. 





相似 的 。 输 出 接口 是 由 一 个 译 码 电路 和 两 个 输出 寄存 器 组 成 ， 一 个 是 an 信和 号 ， 
一 个 是 sseg 信号 ， 如 图 18-5 右 侧 所 示 。 中 断 接口 是 由 一 个 计时 器 和 一 个 触发 器 
标记 组 成 的 ， 如 图 18-5 左 侧 所 示 。HDL 代码 基本 上 遵循 阻塞 图 表 ， 如 示例 18. 2 
所 示 。 

示例 18.2  PicoBlaze 的 基于 方形 回路 的 中 断 


module pico-int 

( 

input wire clk, reset, 

input wire[ 7 : 0 | sw, 

input wire[ 1 ; 0 ] btn, 

output wire[ 3:0] an, 

output wire[ 7 : 0 | эзер 

)s 

// fg FTH] 

// KCPSM3/ROM 信号 

wire[ 9 : 0 | address; 

wire[ 17 ; 0 ] instruction; 

wire[ 7 : 0] port id , out port ; 
reg[ 7:0] in port ; 

wire write strobe , read strobe ; 
wire interrupt , interrupt ack ; 
//VO 端口 信号 

// 输出 使 能 

reg[ 1 :0 1 en-d; 

//4 117 BLED 显示 

reg| 7 : 0 1 sseg-reg; 

гер[ 3:01 an-reg; 

// WEB 

reg btne f lag reg , btns f lag reg ; 
wire btnc_f lag next , btns f lag next ; 
wire set. btne flag, set btns flag, clr Ып flag; 
// 中 有 断 相 关 的 信号 

reg[ 8: 0] timer reg; 


wire[ 8 : 0 | timer next ; 


+ 526 - 用 Verilog 设计 FPGA 样机 实例 解析 (Xilinx Spartan-3 版 ) 





wire ten. us, tick; 
reg timer f lag reg ; 
wire timer f lag next ; 


// 实体 


debounce btnc. unit 

(. elk(clk) , . reset(reset) , . sw(btn[0]) , 

. db-level( ) ,. db-tick ( set-btnc-flag) ) ; 

debounce btns-unit 

( .elk(clk) , . reset (reset ) , . sw (btn ЕШ, 
. db-level( ) ,. db-tick( set-btns-flag) ) ; 


kcpsm3 proc unit 

(. elk( clk) ,. reset( 1° ЬО) ,. address( address), 

. instruction( instruction) , . port id( port id), 

. Write strobe( write strobe) , . out. ро (оці port) , 

. read. strobe( read. strobe) , . in. port(in port), 

. interrupt( interrupt) ,. interrupt. ack( interrupt. ack) ) ; 
Int rom rom unit 

( . elk(clk) , . address (address), 


. instruction ( instruction  ) ; 


// Ша; 
//0-x-00 : an 
//0x01 :ssg 

// VETERE 

always @ ( posedge clk) 
begin 

if(en d[0]) 
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an reg <= out. port[3: 0] ; 
if (en d[1]) 
Sseg reg <= out port ; 

end 
assign an = an reg; 
assign sseg = ѕѕер reg; 
// 解码 电路 使 能 信号 
always € x 
if( write. strobe) 
case ( port-id[ 0] ) 
1'b0; en d =2'bb01; 
ГЫ; en d =2’ b10; 

endcase 
else 


en d -2' b00; 


// fi A Jig LI id 

//0x00 :flag 

//0x01 :switch 

ЛАНТ 

always @ ( posedge clk) 

begin 

btne. flag reg <= btnc flag next; 

btns flag reg <= btns flag next; 

end 

assign btnc. flag next = (set btne flag) ? 1 "bl : 

(сіт btn flag) ? 1' bO; 

btnc-flag-reg ; 

assign btns-flag-next = (set-btns-flag) ? 1'bl ; 
(clr-btn-flag) ? 1' bO ; 

btns-flag-reg ; 

// fri cH EW IIPS HEB 

assign clr_btn_f lag = read_strobe && (port id[0] = -1'b0) ; 
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// 输 人 多 路 复 用 

always @ * 

case ( port, id[ 0] 

1'b0: in port = |6' bO, btns flag reg, btnc flag тер}; 
l'bl: in port = sw; 


endcase 


//10 us 计数 天 

always € ( posedge clk ) 

timer reg <= timer next ; 

assign ten. us tick = (timer reg = 2499) ; 
assign timer next = ten us tick ? 0 ; timer reg +1; 
//10pstickflag 

always @ ( posedge clk) 

timer flag reg <= timer flag next; 

assign timer flag next = (ten us tick) ? l'bl : 
(interrupt ack) ? 1' b0; 

timer flag reg; 

// PT HER 

assign interrupt = timer f lag reg; 

endmodule 


18.6 文献 备注 


本 章 的 文献 备注 信息 和 第 15 章节 到 第 17 章 类 似 。 
18.7 实验 


18.7.1 可 选择 的 计时 器 中 断 服务 程序 


示例 18. 1 的 中 断 服务 程序 用 了 两 个 专门 的 寄存 器 来 记录 时 钟 周期 的 个 数 。 
这 两 个 寄存 器 不 能 被 用 来 做 其 他 的 事情 。 可 选择 的 方案 是 用 一 个 2bit 的 数据 
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RAM 来 实现 这 个 目的 ， 同 时 在 这 个 服务 程序 里 面 使 用 临时 性 的 寄存 器 。 考 虑 到 
一 个 中 断 可 以 发 生 在 任何 时 刻 ， 因 此 我 们 必须 保存 和 复原 相应 的 寄存 器 。 举 一 个 
例子 来 说 ， 当 这 个 计算 完成 的 时 候 ， 如 果 在 这 个 服务 程序 里 面 50 和 51 寄存 器 被 
用 来 计算 ， 它 们 的 内 容 必须 被 保存 ， 当 服务 程序 被 调用 ， 然 后 被 复原 。 得 到 汇编 
的 HDL 代码 ， 编 译 和 综合 这 个 回路 ， 验 证 其 可 操作 性 。 


18.7.2 可 编程 的 计时 器 


我 们 可 以 替代 18.5 节 中 的 mod_500 计数 器 ， 用 一 个 通用 的 mod. m 计数 器 ， 
然后 就 可 以 让 计时 器 实现 可 编程 。 这 个 新 的 计时 器 操作 如 下 : 

ө m 是 一 个 12 位 的 无 符 数据 ; 

em 的 4 个 LSB 是 1111; 

ө 这 个 计时 器 有 一 个 8 位 的 寄存 器 来 保存 m 的 MSB 高 8 位 。 寄 存 器 被 处 理 
过 ， 作 为 PicoBlaze 的 一 个 新 的 输出 端口 ; 

e 一 个 新 的 加 载 寄存 器 的 控制 按钮 。 当 按 下 的 时 候 ，PicoBlaze 输入 这 个 重 
要 信息 ， 源 自 于 8 位 开关 ， 输 出 这 个 重要 信息 到 计时 器 的 寄存 器 里 面 。 

设计 这 个 新 的 VO 接口 ， 得 到 汇编 的 HDL 代码 ， 编 译 ， 综 合 这 个 回路 。 在 
计时 器 加 载 不 同 的 重要 信息 ， 分 析 LED 显示 器 发 生 了 什么 。 


18.7.3 设置 按钮 中 断 服 务 程序 


正如 17. 4 节 所 讨论 的 方形 回路 ， 这 个 按钮 被 用 来 加 载 8 位 开关 a Al 的 操 
作 。 它 的 状态 是 连续 的 ， 在 主 回 路 里 面 。 我 们 可 以 修订 部 分 代码 ， 用 一 个 中 断 机 
制 来 完成 这 个 任务 。 这 个 中 断 服务 程序 包括 几 个 临时 的 寄存 器 ， 然 后 它们 必须 在 
适当 的 时 候 被 保存 或 复原 ， 这 在 实验 18.7. 1 里 面 已 经 讨论 过 。 设 计 这 个 新 的 U 
0 接口 ， 得 到 汇编 HDL 代码 ， 编 译 ， 综 合 这 个 回路 ， 验 证 其 可 操作 性 。 


18.7.4 两 个 请 求 的 中 断 服务 程序 


假定 我 们 可 以 执行 示例 18. 1 中 的 每 一 个 计时 器 的 中 断 请 求 和 实验 18.7.3 里 
PicoBlaze 系统 里 的 设置 按钮 中 断 请 求 。 接 着 讨论 18. 3. 2 节 ， 来 设计 新 的 中 断 接 
口 和 中 断 服务 程序 。 得 到 一 个 汇编 的 HDL 代码 ， 编 译 ， 综 合 这 个 回路 ， 验 证 其 
可 操作 性 。 


18.7.5 4 个 请 求 的 中 断 控制 器 


”一 个 中 断 控制 器 帮助 处 理 机 来 处 理 多重 中 断 请 求 。4 个 请 求 中 断 控制 器 的 阻 
塞 图 ， 如 图 18-6 所 示 。 中 断 控制 器 应 该 包含 4 个 标记 FE， 一 个 特殊 的 优先 编码 
回路 。 如 果 一 个 或 多 个 中 断 请 求 是 激活 的 ， 这 个 控制 器 就 可 以 决定 哪 一 个 请 求 有 
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最 高 的 优先 权 执 行 ， 代 替 它 的 2 位 代码 在 req_id 端口 ， 产 生 int 信号 。 当 PicoB- 
laze 产生 interrupt_ack 信和 号 的 时 候 ， 这 个 控制 器 可 以 清除 掉 相 应 的 标记 FF。 简 单 
来 说 ， 我 们 可 以 假定 int_request_3 有 最 高 的 优先 权 ，int_request_0 有 最 低 的 优先 


权 。 


int request 3 
int request 2 
int request 1 
int request 0 













in port out port 
reset port. id 
read strobe 


instruction write strobe 





interrupt interrupt ack 
address 
KCPSM3 





Ё 18-6 中 断 接 口 ， 用 4 个 请 求 的 中 断 处 理 


得 到 中 断 控制 器 的 HDL 代码 ， 用 这 个 新 的 控制 器 ， 重 复 18.7.4 市 的 实验 
(这 两 个 未 使 用 的 正确 请 求 可 以 被 约束 为 0) 。 


附录 Verilog 举例 


A.1 数值 和 运算 符 


A.1.1 有 符号 数 和 无 符号 数 

























































































数 Ж ff 注 Ж 
5'b11010 11010 
5'bll _010 11010 | _ 间隔 符 
5'032 11010 
5 "Ма 11010 
5' d26 | 11010 
5'b0 00000 0 扩展 
5'b1 00001 | 0 扩展 
5'bz 77777. z 扩 展 
5° bx XXXXX x 扩展 
5'bx01 хобї | x 扩展 
—5" b00001 11111 00001 的 补 码 
*b11010 0000000000000000000000000001 1010 扩展 到 32 位 
' hee 0000000000000000000000001 1101110 扩展 到 32 位 
1 00000000000000000000000000000001 扩展 到 32 位 
=1 11111111111111111111111111111111 扩展 到 32 位 
A.1.2 运算 符 
运算 符 类 型 符号 简单 说 明 | 操作 数 
+ 加 法 2 
Š 减法 2 
* 乘法 2 
算术 运算 符 
/ 除法 2 
% 取 模 | 2 
жож RE 2 
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简单 说 明 








移 位 运算 符 





ABE 





EH 





算术 右 移 





RAAB 





大 于 





小 于 





大 于 等 于 








小 于 等 于 





逻辑 相等 











全 等 





全 不 等 





按 位 非 





按 位 与 








按 位 或 





按 位 异 或 





归 约 与 








归 约 或 








归 约 异 或 
逻辑 非 









逻辑 运算 符 && 


id 








Ein sk 








连接 运算 符 = TIT 


复制 















条 件 运算 符 


A.2 一 般 的 Verilog 构造 


A.2.1 全 部 代码 的 组 成 


示例 A.1 


module bin-counter 








条 件 


全 部 代码 的 组 成 
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// ug НН 

#( parameter N 28) // 上 默认 值 为 8 

// Sigg OBH 

( 
input wire clk, reset, | // WE BRA fr 
input wire syn_clr,load,en, // B AT 
input wire[ N 1:0]d, // ЛЕ 
output wire max tick, // 输出 状态 
output wire[ N-1:0] q // 输出 数据 

2 

// 定义 常量 

localparam MAX =2 * *N-1; 

// 定义 信号 

reg[ N-1:0] r reg, r next; 

// 实体 


// TTE di 
always 9 ( posed ge clk, posedge reset) 
if (reset) 
r reg < =0; 
else 


r_reg < =r_next; 


// ВЧК 
always @ * 
if ( syn, clr) 


r next 20; 
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else if (load) 
r_next = d; 
else if ( en) 
r next =r_reg +1; 
else 
r next =г reg; 
// НЕН 


assign q = r_reg; 


assign max tick = (r_reg = =2 * * N-1) ?1bl : l' b0 


endmodule 


А.2.2 例 化 部 分 
示例 A. 2 例 化 部 分 模版 


module counter-inst 
( 
input wire clk, reset , 
input wire syn clr16,loadl6,enl6, 
input wire[ 15:0] d, 
output wire max tick8, max tickl6, 
output wire[ 15:0] q 
); 
// 实体 
// 例 化 16 {у Bat PIE HEKS 11 
Bin. counter #(. N(16) ) counter. 16. unit 
(. elk( clk) ,. reset( reset) , 
. syn. clr( syn, elr16) ,. load(load16) ,. en(enl6) , 
. d( d) ,. max tick( max tickl6) ,. q(q)) ; 
// PALES WERZA 
// (KHÍ Bl max tick 信和 号 
bin-counter counter-8-unit 
(. elk( clk) ,. reset( reset) , 
. synclr( 1' b0) ,. load(1' bO) ,. en(1' bl), 
. d(8' h00) ,. max tick( max tick8) ,. q( ) ) ; 


附录 Verilog 举例 








endmodule 


A.3 条 件 运 算 符 操作 以 及 证 和 case 语句 


A.3.1 ЖЯ HREM if A) 
示例 A. 3 用 条 件 运 算 符 和 让 语句 设计 的 优先 译 码 器 


( 
input wire[4 : 1] r, 
output wire[2:0] yl, 
output reg[ 2:0] y2 
үү 
// 条 件 控制 符 操 作 
assign yl = (r[4]) ? 3” b100 :// 也 能 用 (r [4 ]= =1 'b1 ) 
(r[3]) ?3’b011 : 
(r[2]) ?3'b010 : 
//W 语句 
// BA A CHEB GL BA FY 
// 用 begin … end HE 
always @ * 
if (r[4]) 
y2 -3' b100; 
else if (r[3]) 
y2 =3’bO11; 
else if (r[2]) 
y2 23' b010; 
else if (r[1]) 
y2 -3' b001; 
else 
y2 =3’ b000; 
endmodule 
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A.3.2 case 语句 
示例 A.4 用 case iE] EI Cat 


module prio encoder case 
( 
input wire[4:1]r , 
output reg[ 2:0] yl,y2 
E 
//case iff] 
// 每 条 分 支 能 够 包 合 多 条 语句 
// 用 begin … end 分 段 
always @ +* 
case (r) 
4' b1000, 4’ b1001, 4' b1010, 4’ b1011, 
4' b1100, 4' b1101, 4' b1110, 4' bl111: 
yl =3’ b100; 
4' b0100, 4'b0101, 4'Ь0110, 4’ b0111 : 
yl =3’b011; 
4' b0010, 4’ b0011: 
yl =3’ b010; 
4' b0001 : 
yl =3’ b001; 
4' boo00 : // th nf LLH default 
yl =3 b000; 
endcase 
//casez 请 句 
always @ * 
casez (г) 
4’b1227; y2 23' b100; // 表示 无 论 为 什么 值 
4'b01??: у2=3”Ь011; 
4' b001?: у2=3”Ь010; 
4' b001 : y2 =3'b001; 
4' b0000: y2 =3’ b000;// th nj LA H default 


endcase 
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endmodule 


A.4 用 always 过 程 块 组 成 的 电路 


A.4.1 过 程 块 无 默认 输出 值 
示例 A.5 always 过 程 块 模版 (无 默认 输出 值 ) 


module compare_no_defult 
( 
input wire a,b, 
output reg gt, eq 
ji 
Ине * 表示 包含 所 有 的 输入 敏感 示例 


// else SPA EBA HS 
// Br SE ETA PAL . 
always @ + 
if (a>b) 
begin 
gt-l'bl; 
eq -1'b0; 
end 
else if(a = =b) 
begin 
gt -1'b0; 
eq -1'bl; 
end 
else// else 4) Xx A HERG Mt 
begin 
gt - 1' b0; 
eg -1 ' b0; 
end 


endmodule 
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А.4.2 过 程 块 输出 有 默认 值 
示例 A. 6 always 过 程 块 模版 (输出 有 默认 值 ) 


module compare_with_default 
( 
input wire a,b, 
output reg gt, eq 
)$ 
// Hie * 表示 包 信 所 有 的 输入 敏感 示例 
// MA Mf C 
always @ x 
begin 
gt=1'b0;// 给 gt BERTI 
eq -1' b0;// 给 eq MAMMA 
if (a>b) 
gt-1'bl; 
else if(a= =b) 
eq -1'bl; 
end 


endmodule 


A.5 存储 组 成 


A.5.1 寄存 器 模版 
示例 A.7 寄存 器 模版 


module reg_template 
( 
input wire clk, reset , 
input wire en, 
input wire[ 7:0] ql next,q2 next,q3. next, 
output reg[ 7:0] q1 reg,q2 reg,q3 reg 


Bat Verilog 举例 


// FAR BEL ЖАКТА 
always € ( posedge clk) 
ql reg < = ql next; 


// FAA BA SENE 
always @ ( posedge clk , posedge reset) 
if ( reset) 
q2 reg < =8’ b0; 
else 


q2 reg < = 42. next; 


// AIEEE 
always @ ( posedge clk , posedge reset) 
if (reset) 
q3 reg < =8’b0; 
else if (en) 
q3 reg < =q3_next; 
endmodule 


А.5.2 寄存 器 文件 
示例 A.8 寄存 器 文件 


module reg_file 
#( 
parameter B =8,// 数据 位 数 
W z2// 地 址 位 数 
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input wire clk, 
input wire wr_en, 
input wire[ W-1:0] w_addr,r_addr, 
input wire[ В-1:0] w_data, 
output wire[ B-1:0]r data 
33 
// 信号 定义 
reg[ B-1 :0 | array_reg[2 * * W-1:0]; 
// 实体 
// SERE 
always @ ( posedge clk) 

if (wr en) 

aray reg[ w addr] < = w. data; 

// 读 操 作 
assign r data = array_reg[ r адаг]; 


endmodule 


//-----_ 

// Universal counter function table 
A — -=-= -= 

//syn elr load еп q* operation 
Еа 

// 1 - - 0 synchronous clear 
ZZ 0 1 - d parallel load 

// 0 0 1 q+l count up 

ee 0 0 0 q pause 
//----—----------------------------------------------- 


module bin_counter 


I Verilog 举例 


#( parameter N =8)// ЖД (8798 
( 

input wire clk, reset, 

input wire syn clr, load, en, 
input wire[ N-1:0 14, 

output wire max tick, 

output wire[ N-1 :0 ]q 

s 

// 数据 定义 

localparam MAX =2 * ж N-1; 
I) 信号 定义 

reg[ N-1:0]r reg, г next; 

// 实体 


// FITA 





// BY PANEL AL 
// 输入 控制 
// RAZE 
// 输出 状态 
// 输出 数据 


always @ ( posedge clk, posedge reset ) 


if (reset) 
r reg < =0; 
else 


r_reg < =r_next; 


JU = = === 
// FARAH 
/= 
always @ * 
if (syn_clr) 
r next =0; 
else if( load) 
r next = d; 


else if ( en) 
r next tr reg +1; 
else 


r next = г reg; 
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// Tf HER 

assign q —r reg; 

assign max tick = (r_reg = 22 * * N-1) ? l' bl ; 1'b0; 
endmodule 


A.7 有 限 状 态 机 


示例 A. 10 ”有限 状态 机 模版 


// ВА. 1 中 的 有 限 状 态 机 代码 
module fsm eg 2 seg 












































a) 状态 转换 图 b) ASM 流 程 图 
图 A-1 一 个 有 限 状 态 机 模版 的 状态 转换 图 和 ASM 流程 图 
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input wire clk, reset, 
input wire a, b, 


output reg yo, yl 


); 

// 状态 符号 定义 

localparam[ 1 :0 ]s0 =21Ь00, 
sl=2'b01, 
s2 =2’ 10; 

// 信号 定义 

reg[ 1: 0] state reg, state. next; 

// ASSET dE 

always @ ( posedge clk , posedge reset ) 


if( reset ) 
state reg < =s0; 
else 
state reg < —state next; 
// BTA EF A fi LUE 
always @ * 
begin 
state next = state reg; 


// BRA МАЖА 


yl =1 b0; // BRU Sa 0 
yO =1 b0; // BRA di 200 
case (state reg) 
50: begin 
yl-l'bl; 
if (a) 
if (b) 
begin 
state next = s2; 
yo=1’bl; 
end 
else 


state_next = sl; 
end 
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sl: begin 
yl =1’bl; 
if(a) 
state_next = s0; 
end 
S2 : state. next =s0; 
default : state. next = 80; 
endcase 
end 


endmodule 


A.8 有 限 状态 机 数据 
示例 A. 11 FSMD 模板 


// TERIA. 2 中 的 FSMD 的 代码 
module fib 

( 

input wire clk, reset, 

input wire start , 

input wire[ 4:0] i, 

output reg ready , done. tick , 

output wire[ 19:0] f 

hi 

// 状态 符号 定义 

localparam[ 1 :0 ] 

idle =2’ b00, 

op -2' b01, 

done 2 2' b10; 

// 信和 号 定义 

reg[ 1:0] state reg, state next; 

reg[ 19:0] 10 reg, 10 next, t1 reg, 1 next; 

reg[ 4:0] n reg, n next; 

// 实体 
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done tick 





一 个 FSMD 模版 的 ASMD 流程 图 


A-2 


// 状态 和 数据 寄存 带 


always @ (posedge clk ,posedge reset) 


if( reset) 


begin 


state reg < = idle; 
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tO_reg < =0; 
tl_reg < =0; 
n_reg < =0; 
end 
else 
begin 


State reg < —state next; 
0 reg < = 10 next; 
tl reg < = next; 


n reg < -n next; 


end 
// 下 一 个 状态 姿 辑 和 数据 传输 功能 单元 
always @ + 
begin 
state next = state reg;// 默认 状态 不 变 
ready = 1' b0; // BRA uo 


done tick -1'b0; — // Ж ТАЮ! 20 
10. next 210. reg; // ТЕЗЕ E— 1 
t] next = tl. reg; // TREE ЕМЕ 
n-next = n reg; КЕР ЕМЕ 
case (state reg) 
idle: 
begin 
ready =1’ dl; 
if (start) 
begin 
t0 next =0; 
t1. next =20’ dl; 
n-next =i; 
state next — op; 
end 
end 
op : 
if (n_reg = = О) 
begin 
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tl_next =0; 
state_next = done; 
end 
else if (n_reg = =1) 
state_next = done; 
else 
begin 
tl] next = tl_reg + 0 reg; 
t0 next =11 reg; 
n next = п reg - 1; 
end 
done : 
begin 
done. tick =1 bl; 
state next — idle; 
end 
default : state next = idle; 
endcase 
end 
// 输出 
assign f -tl reg; 


endmodule 


А.9 S3 开发 板 的 约束 文件 S3. UCF 


# 5| HZ RC 
#Spartan-3 Starter 开发 板 


NET " clk" LOC =" T9" ; 
NET "reset" LOC = "114"; 
# 按 馈 和 开关 
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# ======================================================= 
#4 个 按 

NET "btn(0)" LOC =" MI3" ; 

NET "btn(1)" LOC ="М14"; 

NET "btn(2) " DOC =" 113"; 

# NET "btn(3)" LOC = "114"; #btin《3) 也 可 以 用 作 复 位 

#8 TAIFA 

NET "sw(0)" LOC ="F12"; 

NET "sw(1)" LOC ="G12"; 

NET "sw(2)" LOC ="H14"; 

NET "sw(3)" LOC = "НІЗ"; 

NET "sw(4)" LOC ="J14" ; 

NET "sw(5)" LOG ="J13" ; 

NET "sw(6)" LOC 2"Kl4" ; 

NET "sw(7)" LOC = "КІЗ"; 

# ======================================================= 
# RS232 
#======================================================= 
NET " rx" LOC 2"TI3" | DRIVE =8 | SLEW =SLOW; 

NET " tx" LOC ="R13" | DRIVE 28 | SLEW =SLOW; 

4 ======================================================= 
84 个 数字 多 路 七 段 发 光一 

«ICE IE aN at 
THT============================================x=========== 
# 数 字 使 能 

NET "ап(0)" LOC = "014"; 

NET "an(1) " LOC 2"Gl4" ; 

NET "an(2) " LOC ="F14"; 

NET "an(3) " LOC = "E13" ; 

#7 BRITE AAC 

NET " sseg(7) " LOC 2"P16" ;#decimal point 

NET " sseg(6) " LOC =" E14" ;fsegment a 

NET "sseg(5)" | LOC ="G13" ;sfsegment b 

NET "sseg(4)" LOC =" №5" ;#segment c 

NET " sseg(3) " LOC = "Р15" ; #ѕертепі d 
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NET "sseg(2)" LOC =" R16" ;Zsegment e 
NET "sseg(1)" LOC ="F13" ;#segment f 
NET "sseg(0)" 10С =" №6" ;#segment g 


g======================================================= 
#8 ТЕВЕ ЭЕ AE 

# ======================================================= 
NET "led(0)" — LOC-"KI2"; 

NET "led(1)" | LOC-"PI4"; 

NET "led(2)" — LOC-"LI2"; 

NET "led(3)" — LOC-"NI4"; 

NET "led(4)" — LOC-"PI3"; 

МЕТ "led(5)" | LOC-"NI2"; 

МЕТ "led(6)" — LOC-"PI2"; 

NET "led(7)" | LOC-"PII"; 
#======================================================= 
# 视 频 图 形 阵 列 
#======================================================= 
NET "rgb(2)" — LOC ="R12" | DRIVE -8 | SLEW = FAST; 


NET " rgb(1)" LOC ="T12" | DRIVE =8 | SLEW = FAST; 
NET " rgb(0) " LOC ="R11" | DRIVE =8 | SLEW = FAST; 
NET "vsyne " LOC ="T10" | DRIVE =8 | SLEW = FAST; 
NET " hsync " LOC ="R9" | DRIVE =8 | SLEW = FAST; 


NET " ps2c" LOC =" M16" | IOSTANDARD = LVCMOS33 | DRIVE = 8 
ISLEW = SLOW; 

NET " ps2d1 " LOC =" М15" | IOSTANDARD = LVCMOS33 | DRIVE = 8 
ISLEW = SLOW; 


# 共 用 的 18 位 存储 地 址 
NET "ad(17)" LOC = "13" | IOSTANDARD = LVCMOS33 | SLEW = FAST; 
NET "ad(16)" LOC =" KS" | IOSTANDARD = LVCMOS33 | SLEW = FAST; 
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NET "ad(15)" 
NET "ad(14)" 
NET "ad(13)" 
NET "ad(12)" 
NET "ad(11)" 
NET "ad(10)" 
NET "ad(9)" 
NET "ad(8)" 
NET "ad(7)" 
NET "ad(6)" 
NET "ad(5)" 
NET "ad(4)" 
NET "ad(3)" 
NET "ad(2)" 
NET "ad(1)" 
NET "ad(0)" 
# ЖЕШСЕ BERE 
NET "oe n" 
NET " we n" 


LOC =" КЗ" | IOSTANDARD = LVCMOS33 | SLEW = FAST; 
LOC ="J3" | IOSTANDARD = LVCMOS33 | SLEW = FAST; 
LOC ="J4" | IOSTANDARD = LVCMOS33 | SLEW = FAST; 


LOC = "На" 
LOC = " H3" 
LOC - "GS" 
LOC = "Ед" 
LOG 835 
LOC =" F4" 
LOC = "ga 
LOC =" G4" 
LOC = "ТА" 
LOC = " M3" 
LOC =" M4" 
LOC = "№" 
LOG s "15" 
LOC - " K4" 
LOC 2" G3" 


| IOSTANDARD = LVCMOS33 
| IOSTANDARD = LVCMOS33 
I IOSTANDARD = LVCMOS33 
I IOSTANDARD = LVCMOS33 
| IOSTANDARD = LVCMOS33 
| IOSTANDARD = LVCMOS33 
I IOSTANDARD = LVCMOS33 
I IOSTANDARD = LVCMOS33 
| IOSTANDARD = LVCMOS33 
| IOSTANDARD = LVCMOS33 
| IOSTANDARD = LVCMOS33 
I IOSTANDARD = LVCMOS33 
| IOSTANDARD = LVCMOS33 


| IOSTANDARD = LVCMOS33 
I IOSTANDARD = LVCMOS33 


# 表态 存储 底片 1 HIREA , ite, rfi e 
LOC="RI" | IOSTANDARD = LVCMOS33 | SLEW = FAST; 


NET "dio a(15)" 
NET "dio a(14)" 
NET "dio a(13)" 
NET "dio a(12)" 
NET "dio a(11)" 
NET "dio a(10)" 
NET "dio a(9)" 
NET "dio a(8)" 
NET "dio a(7)" 
NET "dio a(6)" 
NET "dio a(5)" 
NET "dio a(4)" 
NET "dio a(3)" 
NET "dio a(2)" 
NET "dio a(1)" 


I IOSTANDARD = LVCMOS33 
I IOSTANDARD = LVCMOS33 


| SLEW = FAST; 
| SLEW = FAST; 
| SLEW = FAST; 
| SLEW = FAST; 
| SLEW = FAST; 
| SLEW = FAST: 
| SLEW = FAST; 
| SLEW =FAST; 
| SLEW = FAST; 
| SLEW = FAST; 
| SLEW = FAST; 
| SLEW =FAST; 
| SLEW = FAST; 


| SLEW = FAST; 


| SLEW = FAST; 


| SLEW =FAST; 
| SLEW =FAST; 


| IOSTANDARD = LVCMOS33 | SLEW = FAST; 


LOC ="Н1" | IOSTANDARD = LVCMOS33 | SLEW = FAST; 


LOC = "Pi" 
LOC = "12" 
LOG. P w 
LOC =" F2" 
LOC "pae 
LOC ="D3" 
LOC = "ВІ" 
LOC = "CI" 
LOG s "Co" 
LOC =" RS" 
LOC = "Т5" 
LOC - " R6" 
LOC - "T8" 


I IOSTANDARD = LVCMOS33 
I IOSTANDARD = LVCMOS33 
I IOSTANDARD = LVCMOS33 
I IOSTANDARD = LVCMOS33 
| IOSTANDARD = LVCMOS33 
I IOSTANDARD = LVCMOS33 
I IOSTANDARD = LVCMOS33 
I IOSTANDARD = LVCMOS33 
| IOSTANDARD = LVCMOS33 
I IOSTANDARD = LVCMOS33 


| SLEW = FAST; 
| SLEW = FAST; 
| SLEW = FAST; 
| SLEW = FAST; 
| SLEW = FAST; 
| SLEW = FAST; 
| SLEW = FAST; 
| SLEW = FAST; 
| SLEW = FAST; 
| SLEW = FAST; 
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NET "dio a(0)" 
NET "ce a n" 
NET "ub a n" 
NET "Ib a n" 


LOC = " N7" 
LOC « "P7" 
LOG ="T4" 
LOC = "Рб" 


I IOSTANDARD = LVCMOS33 | SLEW = FAST; 
| IOSTANDARD = LVCMOS33 | SLEW = FAST; 
| IOSTANDARD = LVCMOS33 | SLEW = FAST; 
| IOSTANDARD = LVCMOS33 | SLEW = FAST; 


3 BESTE ASI rl НСА, А, PET Tz 





| IOSTANDARD = LVCMOS33 | SLEW = FAST; 
| IOSTANDARD = LVCMOS33 | SLEW = FAST; 
I IOSTANDARD = LVCMOS33 | SLEW = FAST; 
| IOSTANDARD = LVCMOS33 | SLEW = FAST; 
I IOSTANDARD = LVCMOS33 | SLEW = FAST; 
| IOSTANDARD = LVCMOS33 | SLEW = FAST; 
| IOSTANDARD = LVCMOS33 | SLEW = FAST; 
| IOSTANDARD = LVCMOS33 | SLEW = FAST; 
| IOSTANDARD = LVCMOS33 | SLEW = FAST; 
| IOSTANDARD = LVCMOS33 | SLEW = FAST; 
| IOSTANDARD = LVCMOS33 | SLEW = FAST; 


LOC 2"JI" | IOSTANDARD = LVCMOS33 | SLEW = FAST; 


NET "dio b(15)" LOC "NI" 
NET "dio b(14)" LOC -"MI" 
NET "dio b(13)" LOC ="K2" 
NET "dio b(12)" LOC ="C3" 
NET "dio b(11)" LOC-"FS" 
NET "dio b(10)" LOC -"GI" 
NET "dio b(9)" | LOC ="E2" 
NET "dio b(8)" LOC ="D2" 
NET "dio b(7)" | LOC 2 "DI" 
NET "dio b(6)" LOC -"EIl" 
NET "dio b(5)" LOC ="G2" 
NET "dio b(4)" 

NET "dio b(3)" LOC 2 "KI" 
NET "dio b(2)" LOC =" М2" 
NET "dio b(1)" LOC-"N2" 
NET "die b(0)" LOC 2" P2" 
МЕТ "се b n' — LOC-"N5" 
NET "ub b n" — LOC-"R4" 
NET "Ib b n" — LOC ="P5" 
# 夺 序 约束 53 板 上 的 50MHz 

# diei ds 

8 Phas AS ERE clk 


NET "clk" TNM NET = " сік" ; 
TIMESPEC "TS clk" = PERIOD "clk" 40 ns HIGH 50 96 ; 


| IOSTANDARD = LVCMOS33 | SLEW = FAST; 
| IOSTANDARD = LVCMOS33 | SLEW = FAST; 
| IOSTANDARD = LVCMOS33 | SLEW = FAST; 
I IOSTANDARD = LVCMOS33 | SLEW = FAST; 
| IOSTANDARD = LVCMOS33 | SLEW = FAST; 
| IOSTANDARD = LVCMOS33 | SLEW = FAST; 
| IOSTANDARD = LVCMOS33 | SLEW = FAST; 
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